weidagang2046的專欄

          物格而后知致
          隨筆 - 8, 文章 - 409, 評論 - 101, 引用 - 0
          數(shù)據(jù)加載中……

          用grep函數(shù)提取文件中符合規(guī)則的行

          提取以ID(共4字符,首字符為數(shù)字,其余三個字符為數(shù)字或字母),chain或region開始的行:

          1i95
          complexed with ede, mg, wo2, zn
          chain q [62030]  
          1e7z
          contains C-terminal His tag
          complexed with hg
          chain a [25318]  
          1khi  
          region a:103-173 [77409]  
          1fgu  
          the N-terminal two domains free
          region a:181-298 [25296]  
          region a:299-426 [25297]  
          region b:181-289 [25298]  
          region b:298-426 [25299]  
          1hnz  
          complexed with hyg, mg, zn
          chain q [25354]  
          1gd7  
          chain a [60441]  
          chain b [60442]  
          chain c [60443]  
          chain d [60444]

          $file = $ARGV[0];

          open(FH, $file|| die "Can not open $file: $!\n";

          @lines = <FH>;

          @extract = grep(/(^\d\w{3}$)|(^(chain|region))/, @lines);

          print @extract;

          posted on 2006-03-09 09:19 weidagang2046 閱讀(916) 評論(0)  編輯  收藏 所屬分類: Perl

          主站蜘蛛池模板: 石城县| 肥乡县| 柳州市| 河源市| 石城县| 锦屏县| 金湖县| 菏泽市| 边坝县| 台江县| 山丹县| 油尖旺区| 南京市| 松潘县| 巢湖市| 开鲁县| 东港市| 赤峰市| 东源县| 澎湖县| 肃南| 平原县| 阆中市| 逊克县| 台南市| 新野县| 蒙阴县| 英德市| 广饶县| 炉霍县| 九龙坡区| 酉阳| 墨江| 韶关市| 田东县| 京山县| 涿鹿县| 马公市| 绥棱县| 兴城市| 锡林郭勒盟|