Dev@Free

          zJun's Tech Weblog

          Find duplicate records in text file

          Example:
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452
          aer 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          UNIX:

          display the no of occurance and the record
          > sort f1.txt|uniq -c
             2 abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
             1 aer 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
             2 tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          display only the duplicate records
          > sort f1.txt|uniq -d
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          display distinct records
          > sort f1.txt|uniq
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          aer 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          Reference:
          Shell: How To Remove Duplicate Text Lines

          Windows:

          Notepad++ can sort by line, and remove the duplicate lines at the same time.
          1. Open the menu under: TextFX-->TextFX Tools
          2. Make sure "sort outputs only unique..." is checked
          3. select a block of text (ctrl-a to select the entire document).
          4. click "sort lines case sensitive" or "sort lines case insensitive"

          posted on 2012-04-11 12:10 zJun's帛羅閣 閱讀(485) 評論(0)  編輯  收藏 所屬分類: 開發環境

          導航

          <2012年4月>
          25262728293031
          1234567
          891011121314
          15161718192021
          22232425262728
          293012345

          統計

          常用鏈接

          留言簿(15)

          隨筆分類

          隨筆檔案

          相冊

          收藏夾

          博客

          文檔

          站點

          論壇

          搜索

          積分與排名

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 寿阳县| 肥西县| 惠来县| 高台县| 和政县| 中超| 定陶县| 东乡县| 湟中县| 吴桥县| 屏南县| 靖西县| 都兰县| 尼玛县| 罗甸县| 百色市| 连山| 米泉市| 印江| 甘泉县| 永登县| 灌阳县| 凤城市| 甘孜| 阳江市| 杭锦旗| 瓮安县| 邳州市| 玉树县| 宁阳县| 沙雅县| 兴化市| 改则县| 琼中| 张家港市| 大英县| 丘北县| 温宿县| 乌兰县| 故城县| 清河县|