過濾訪問日志里的無效ip和robot

          定期更新ip的腳本:

          #!/bin/sh
          #定時更新公司IP, 以用來過濾
          #author: Felix Zhang
          #date: 2012-12-29

          filedir=/opt/logdata/companyip

          adate=$(date -d "today" +"%Y%m%d")
          filename="${filedir}/ip.${adate}"
          ip=`/usr/bin/host yourcompany.3322.org|awk '{print $4}'`
          if [ '' != "`grep $ip ${filename}`" ]; then
              exit 0
          fi

          echo "$ip" >> ${filename}


          #Set how long you want to save
          save_days=30

          #delete 30 days ago nginx log files
          find ${filedir} -mtime +${save_days} -exec rm -rf {} \; 

          分析日志的腳本:


          #!/bin/sh
          ipdir=/opt/logdata/companyip
          adate=$(date -d "today" +"%Y%m%d")
          ipfile="${ipdir}/ip.${adate}"
          ipreg="127.0.0.1"
          if [ -e ${ipfile} ]; then
                  ipreg=`cat ${ipfile} |sed ':a N;s/\n/|/;ta'`
                  echo "1"
          fi
          if [ "${ipreg}" = ""  ]; then
             ipreg="127.0.0.1"
             echo "2"
          fi
          echo ${ipreg}
          #cat ip.test |grep -E -v  '127.0.0.1|126.23.23.44'
          fileName=$1;
          echo '分析文件'$fileName

          cat $fileName | egrep  -v ${ipreg} |awk '{print $7}'

          這樣分析日志時就可以過濾掉自己公司的IP了. 當然根據機器人的特征也可以過濾機器人, 此處不在多說了, 此處僅給出幾個機器人

          cat ${logfile} |grep -E -v ${ipreg} |grep -E -v "DNSPod-monitor|bot.htm|spider.htm|webmasters.htm" >${cleanlogfile}



          posted on 2013-01-09 23:56 Scud(飛云小俠) 閱讀(1931) 評論(0)  編輯  收藏 所屬分類: 其他

          <2013年1月>
          303112345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          導航

          統計

          公告

          文章發布許可
          創造共用協議:署名,非商業,保持一致

          我的郵件
          cnscud # gmail


          常用鏈接

          留言簿(15)

          隨筆分類(113)

          隨筆檔案(103)

          相冊

          友情鏈接

          技術網站

          搜索

          積分與排名

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 浮梁县| 淮北市| 饶河县| 德阳市| 长汀县| 堆龙德庆县| 工布江达县| 宁明县| 河北省| 郑州市| 武清区| 新巴尔虎右旗| 元阳县| 巫溪县| 武定县| 新和县| 吐鲁番市| 阿图什市| 游戏| 仁寿县| 安乡县| 九台市| 屏东市| 津南区| 沐川县| 扶沟县| 股票| 双流县| 延边| 宁化县| 遵义市| 安平县| 菏泽市| 琼中| 万荣县| 连江县| 宁南县| 恭城| 朝阳区| 财经| 玉屏|