過濾訪問日志里的無效ip和robot

          定期更新ip的腳本:

          #!/bin/sh
          #定時更新公司IP, 以用來過濾
          #author: Felix Zhang
          #date: 2012-12-29

          filedir=/opt/logdata/companyip

          adate=$(date -d "today" +"%Y%m%d")
          filename="${filedir}/ip.${adate}"
          ip=`/usr/bin/host yourcompany.3322.org|awk '{print $4}'`
          if [ '' != "`grep $ip ${filename}`" ]; then
              exit 0
          fi

          echo "$ip" >> ${filename}


          #Set how long you want to save
          save_days=30

          #delete 30 days ago nginx log files
          find ${filedir} -mtime +${save_days} -exec rm -rf {} \; 

          分析日志的腳本:


          #!/bin/sh
          ipdir=/opt/logdata/companyip
          adate=$(date -d "today" +"%Y%m%d")
          ipfile="${ipdir}/ip.${adate}"
          ipreg="127.0.0.1"
          if [ -e ${ipfile} ]; then
                  ipreg=`cat ${ipfile} |sed ':a N;s/\n/|/;ta'`
                  echo "1"
          fi
          if [ "${ipreg}" = ""  ]; then
             ipreg="127.0.0.1"
             echo "2"
          fi
          echo ${ipreg}
          #cat ip.test |grep -E -v  '127.0.0.1|126.23.23.44'
          fileName=$1;
          echo '分析文件'$fileName

          cat $fileName | egrep  -v ${ipreg} |awk '{print $7}'

          這樣分析日志時就可以過濾掉自己公司的IP了. 當然根據機器人的特征也可以過濾機器人, 此處不在多說了, 此處僅給出幾個機器人

          cat ${logfile} |grep -E -v ${ipreg} |grep -E -v "DNSPod-monitor|bot.htm|spider.htm|webmasters.htm" >${cleanlogfile}



          posted on 2013-01-09 23:56 Scud(飛云小俠) 閱讀(1927) 評論(0)  編輯  收藏 所屬分類: 其他

          <2013年1月>
          303112345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          導航

          統計

          公告

          文章發布許可
          創造共用協議:署名,非商業,保持一致

          我的郵件
          cnscud # gmail


          常用鏈接

          留言簿(15)

          隨筆分類(113)

          隨筆檔案(103)

          相冊

          友情鏈接

          技術網站

          搜索

          積分與排名

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 湾仔区| 内黄县| 翁牛特旗| 景谷| 萝北县| 乐至县| 丹巴县| 天气| 唐海县| 额敏县| 奇台县| 萨迦县| 郓城县| 峨山| 兰州市| 莲花县| 如东县| 康乐县| 商城县| 龙胜| 西乌珠穆沁旗| 金门县| 丹寨县| 安图县| 广宁县| 延长县| 清流县| 叙永县| 疏附县| 颍上县| 界首市| 泉州市| 伊春市| 怀远县| 北票市| 二手房| 嵩明县| 冕宁县| 马鞍山市| 泰顺县| 张家口市|