凉风有信,秋月无边
亏我思娇的情绪、好比度日如年

linux宝塔面板蜘蛛统计脚本(站群/多站版)脚本下载

文章摘要

这篇文章介绍了利用Bash脚本统计网站蜘蛛数量的方法。脚本的主要功能是循环遍历指定的域名列表(`domain`)和搜索引擎列表(`spider`),并在每个域名的日志文件中统计指定搜索引擎的访问次数。脚本会输出到指定日志目录,并且可以配置成每天定时任务运行。需要注意的是,脚本需在Linux环境下运行,且要在脚本文件中设置700权限。

说明:

spider是蜘蛛标识,domain是要统计蜘蛛的站点域名,只统计当天的蜘蛛。

如果需要记录/分析每天的蜘蛛情况,可以将脚本添加定时任务(23:59)执行,并追加输出到txt文件。

例如:将脚本命名为spider.sh 保存,再使用crontab命令添加定时任务(注意:spider.sh文件需要700权限)。

59 23 * * * sh /www/spider.sh>>/www/spider.txt

代码粗陋,还望各位笑纳。高手可以各自完善。  提供liunx格式的脚本下载 防止windows跟liunx的编辑软件冲突导致代码出问题!

#!/bin/bash

m="$(date +%m)"
case $m in
  "01") m='Jan';;
  "02") m='Feb';;
  "03") m='Mar';;
  "04") m='Apr';;
  "05") m='May';;
  "06") m='Jun';;
  "07") m='Jul';;
  "08") m='Aug';;
  "09") m='Sep';;
  "10") m='Oct';;
  "11") m='Nov';;
  "12") m='Dec';;
esac
d="$(date +%d)"

spider=(
  Googlebot
  Baiduspider
  baiduboxapp
  Sogou
  YisouSpider
  360Spider
  Bytespider
)
domain=(
www.1004619.com
)

for j in ${domain[*]}; do
    echo $j
    for i in ${spider[*]}; do
      echo -e "$i 	" `cat /www/wwwlogs/$j.log |grep $d/$m|grep $i|wc -l`
    done
    echo "--------------------------------------------------------"
done

 

赞(0) 打赏
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《linux宝塔面板蜘蛛统计脚本(站群/多站版)脚本下载》
文章链接:https://www.1004619.com/biji/20230801183.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫