weidagang2046的專欄

          物格而后知致
          隨筆 - 8, 文章 - 409, 評論 - 101, 引用 - 0
          數據加載中……

          用grep函數提取文件中符合規則的行

          提取以ID(共4字符,首字符為數字,其余三個字符為數字或字母),chain或region開始的行:

          1i95
          complexed with ede, mg, wo2, zn
          chain q [62030]  
          1e7z
          contains C-terminal His tag
          complexed with hg
          chain a [25318]  
          1khi  
          region a:103-173 [77409]  
          1fgu  
          the N-terminal two domains free
          region a:181-298 [25296]  
          region a:299-426 [25297]  
          region b:181-289 [25298]  
          region b:298-426 [25299]  
          1hnz  
          complexed with hyg, mg, zn
          chain q [25354]  
          1gd7  
          chain a [60441]  
          chain b [60442]  
          chain c [60443]  
          chain d [60444]

          $file = $ARGV[0];

          open(FH, $file|| die "Can not open $file: $!\n";

          @lines = <FH>;

          @extract = grep(/(^\d\w{3}$)|(^(chain|region))/, @lines);

          print @extract;

          posted on 2006-03-09 09:19 weidagang2046 閱讀(916) 評論(0)  編輯  收藏 所屬分類: Perl

          主站蜘蛛池模板: 肇庆市| 深圳市| 黄冈市| 温州市| 电白县| 台东县| 大理市| 芜湖县| 仲巴县| 岢岚县| 临邑县| 通渭县| 海兴县| 镶黄旗| 富阳市| 樟树市| 唐河县| 平武县| 都江堰市| 中西区| 乡城县| 廉江市| 弥勒县| 洛川县| 红原县| 荆州市| 锡林浩特市| 廉江市| 鞍山市| 合作市| 上高县| 峨边| 怀化市| 侯马市| 南乐县| 临洮县| 扎赉特旗| 北碚区| 吉木乃县| 富阳市| 南城县|