Dev@Free

          zJun's Tech Weblog

          Find duplicate records in text file

          Example:
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452
          aer 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          UNIX:

          display the no of occurance and the record
          > sort f1.txt|uniq -c
             2 abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
             1 aer 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
             2 tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          display only the duplicate records
          > sort f1.txt|uniq -d
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          display distinct records
          > sort f1.txt|uniq
          abc 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          aer 1000 3452 2463 2343 2176 7654 3452 8765 5643 3452
          tas 3420 3562 2123 1343 2176 7654 3252 8765 5643 3452

          Reference:
          Shell: How To Remove Duplicate Text Lines

          Windows:

          Notepad++ can sort by line, and remove the duplicate lines at the same time.
          1. Open the menu under: TextFX-->TextFX Tools
          2. Make sure "sort outputs only unique..." is checked
          3. select a block of text (ctrl-a to select the entire document).
          4. click "sort lines case sensitive" or "sort lines case insensitive"

          posted on 2012-04-11 12:10 zJun's帛羅閣 閱讀(485) 評論(0)  編輯  收藏 所屬分類: 開發環境

          導航

          <2012年4月>
          25262728293031
          1234567
          891011121314
          15161718192021
          22232425262728
          293012345

          統計

          常用鏈接

          留言簿(15)

          隨筆分類

          隨筆檔案

          相冊

          收藏夾

          博客

          文檔

          站點

          論壇

          搜索

          積分與排名

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 麟游县| 屏山县| 呼图壁县| 邵武市| 古田县| 辉南县| 丰台区| 壤塘县| 阿拉善左旗| 千阳县| 塔河县| 东阳市| 萨嘎县| 泽普县| 南江县| 绥阳县| 曲靖市| 哈密市| 永清县| 清原| 射阳县| 周宁县| 邮箱| 五原县| 元氏县| 荃湾区| 边坝县| 夏邑县| 邮箱| 光山县| 鹿泉市| 双牌县| 安宁市| 饶阳县| 西平县| 安塞县| 广昌县| 德保县| 岗巴县| 两当县| 集贤县|