過濾訪問日志里的無效ip和robot

          定期更新ip的腳本:

          #!/bin/sh
          #定時更新公司IP, 以用來過濾
          #author: Felix Zhang
          #date: 2012-12-29

          filedir=/opt/logdata/companyip

          adate=$(date -d "today" +"%Y%m%d")
          filename="${filedir}/ip.${adate}"
          ip=`/usr/bin/host yourcompany.3322.org|awk '{print $4}'`
          if [ '' != "`grep $ip ${filename}`" ]; then
              exit 0
          fi

          echo "$ip" >> ${filename}


          #Set how long you want to save
          save_days=30

          #delete 30 days ago nginx log files
          find ${filedir} -mtime +${save_days} -exec rm -rf {} \; 

          分析日志的腳本:


          #!/bin/sh
          ipdir=/opt/logdata/companyip
          adate=$(date -d "today" +"%Y%m%d")
          ipfile="${ipdir}/ip.${adate}"
          ipreg="127.0.0.1"
          if [ -e ${ipfile} ]; then
                  ipreg=`cat ${ipfile} |sed ':a N;s/\n/|/;ta'`
                  echo "1"
          fi
          if [ "${ipreg}" = ""  ]; then
             ipreg="127.0.0.1"
             echo "2"
          fi
          echo ${ipreg}
          #cat ip.test |grep -E -v  '127.0.0.1|126.23.23.44'
          fileName=$1;
          echo '分析文件'$fileName

          cat $fileName | egrep  -v ${ipreg} |awk '{print $7}'

          這樣分析日志時就可以過濾掉自己公司的IP了. 當然根據機器人的特征也可以過濾機器人, 此處不在多說了, 此處僅給出幾個機器人

          cat ${logfile} |grep -E -v ${ipreg} |grep -E -v "DNSPod-monitor|bot.htm|spider.htm|webmasters.htm" >${cleanlogfile}



          posted on 2013-01-09 23:56 Scud(飛云小俠) 閱讀(1931) 評論(0)  編輯  收藏 所屬分類: 其他

          <2013年1月>
          303112345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          導航

          統計

          公告

          文章發布許可
          創造共用協議:署名,非商業,保持一致

          我的郵件
          cnscud # gmail


          常用鏈接

          留言簿(15)

          隨筆分類(113)

          隨筆檔案(103)

          相冊

          友情鏈接

          技術網站

          搜索

          積分與排名

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 钟祥市| 临湘市| 阳高县| 方城县| 开封县| 育儿| 永新县| 体育| 庆元县| 万年县| 霍城县| 英吉沙县| 清丰县| 灵台县| 东城区| 稷山县| 白城市| 来凤县| 开阳县| 昭觉县| 南华县| 合山市| 霍邱县| 汤阴县| 新建县| 江源县| 石泉县| 修水县| 尼木县| 彰武县| 吴忠市| 安乡县| 大洼县| 开平市| 垣曲县| 望奎县| 阳谷县| 鸡泽县| 寻乌县| 开远市| 玛多县|