BioJava In Anger快速指?/span>介绍Q?/span>BioJava 的设计涵盖了生物信息学的很多斚wQ本w就比较复杂和庞大,有时候甚至o人生畏。对于那些想快速了解ƈ且利用这个强大的工具的生物信息学家们来说Q有时候面对这一大堆的接口常怼头痛Ʋ裂。本指南能够帮助你利?span class="SpellE">BioJava开?span lang="EN-US">99Q常用的E序Q而不必ؓ此掌?span lang="EN-US">99Q的BioJava接口?/span> 本指南用多数编E快速指南的格式Q采用“我如何使用.....”的主题形式来帮助大家?span class="SpellE">BioJava。每个主题都提供你可能会期望q经怋用的源代码。这些代码基本上可以直接在你的机器中~译q行。我量详细注释q些代码Q让大家更容易理解程序中可能的一些晦涩代码?/span> ?span class="SpellE">BioJava In Anger”由Mark Schreiberl护。Q何徏议和问题误p?span lang="EN-US">biojava mailing list。点?span lang="EN-US">q里订阅邮g列表?/span> 本指南用的例子l过BioJava1.3, Java1.4试?/span> 本指南中文版?span lang="EN-US"> Wu Xin(Center of Bioinformatics,Peking University)译,M译问题请通过邮g列表联系或者登?span lang="EN-US">BBS?/span> 我如何?span lang="EN-US">.......?安装> 安装Java 成分?span lang="EN-US">(alphabets)和标?span lang="EN-US">(symbol)>我如何徏立杂交物成分表(cross product alphabet),例如密码字成分表(codon alphabet)? >我如何从杂交产物成分?cross product alphabet)中分解出他们的组成标?component symbol)? >我如何徏立一个多义标?ambiguous symbol),例如Y或R? 基本序列操作译(translation)序列输入输出(sequence I/O)>我如何读取GenBank/EMBL/SwissProt格式的文?/span> >我如何从GenBank/EMBL/SwissProt格式中抽取序列ƈ且以FASTA格式输出? 注释(annotation)位置和特?span lang="EN-US">(location and feature)>我如何指定一?span class="GramE">域位|?/span>(range location)? BLAST?span lang="EN-US">FASTA计数和分?span lang="EN-US">(count and distribution)>我如何能扑ֈ一U简单的Ҏ来判断两U分布是否具有相同的权重? >我如何对一个自定义的成分表创徏一个N阶分?order N distribution)? 权重矩阵和动态规?span lang="EN-US">(weight matrix and dynamic programming)>我如何利用一个权重矩?span class="GramE">L模体? >我如何创?span class="GramE">一个隐马模?/span>?profile HMM)? 用户界面(user interfaces)OBDA免责声明:q些源代码由各个作者A?span lang="EN-US">,管l过我们试,但仍然可能有错误发生。所有代码可以免费用,但我们ƈ不保证和负责代码的正性。在使用前,误我测试?/span> 版权Q?/span>本站文档属于其A献者。如果在出版物中使用Q请先垂?span lang="EN-US">biojava mailing list。源代码?span lang="EN-US">开放资?/span>,如果你同意其声明则可以免费用?/span> |
Maintainted by Wu Xin, CBI, Peking University, China, 2003 |
Bioperl 最q已l到?.0?先说bioperl.org,该组l正式成立于1995q?在此之前已经作ؓ非正式的团体存在那很多年,现在他已lŞ成了一个国? 性的开发者的协会,q些开发者开发用于生物信息学,基因l学,和生命科学研I的开放源码的Perl 工具.
该组l的支持者和推动者是Open Bioinformatics Foundation. 他们的伙伴还有biojava.org, biopython.org, DAS, bioruby.org, biocorba.org, ENSEMBL ?EMBOSS.
Bioperl的服务器提供供下列服?用于生命U学的基于perl的模?脚本,web联接的Y?
Bioperl现在已发展成Z个o人瞩目的国际性的自由软g开发计划,bioperl在生物信息学的用加速了生物信息学、基因组学以及其他生? U学研究的发展。最qbioperl 1.0版本正式发布Q这光历时七年Q成l斐然。Bioperl 1.0 包括832个文Ӟ93个ScriptQ功能丰富,源码全部开放。它是生物信息学研究的利器。详l的内容大家可以讉Kwww.bioperl.org?/p>
Bioperl作ؓperl的扩充的专门用于生物信息的工具与函数?自然也承了perl的众多优?
W一. Perl强大的正则表C式(regular expression)比对以及字符串操作ɘq个工作变得单而没有其它语a能相比。Perl 非常擅长于切Ԍ扭{Q绞Q弄qIȝQ以及其它的操作文字文g。生物资料大部分是文字文?物种名称,U属关系Q基因或序列的注解,评住Q目录查? 甚至DNA序列也是cL字的。现在互怺换以以文字文件的形式存在的但是具有不兼容的资料格式生物信息资料是一个很头疼的问?perl的这个方面的? ?可以在这一斚w解决不少问题.
W二. Perl 能容错。生物资料通常是不完全的,错误或者说误差从数据的产生时候可能就产生?另外生物数据的某值栏位可以被忽略 ,可能是空着的,或是某个栏位也就是某个?被预期要出现好几?举例来说Q一个实验可能被重复的操?Q或是资料以手动输入所以有错误。Perlq不? 意某个值是I的或是有奇怪的字符。正规表C式能够被写成取出ƈ且更正错误的一般错误。当然这U弹性也可能是各坏处?
q有,Perl 是组件导向的。Perl 鼓励Z他们的软g写成模l,不论是用 Perl 函式库模l或是正l的
Unix 工具导向的方式。外部程序能够轻易的被整合进 Perl E序,靠着道(pipe),pȝ呼叫,或是插(socket)。Perl5
引进的动态蝲入器允许Z使用 C 的函式,或者让整个~程q的函式库,被用在 Perl
直译器中。最q的成果是世界各地的l晶都会收录在一l模l里面,UCؓ”bioPerl”(请参?Perl JournalQ?br>
Perl
很容易去写ƈ且能很快开发完。直译器让你不需要宣告你所有的函数型式以及资料型态,当未定义的函式被呼叫时只会引起一个错误,除错器也能与Emacs很好
的合作ƈ且让你能用o服的交谈式的开发模式?br>
Perl 是良好的原型语言。因为它快而且?quick and dirty)Q用 Perl
建构新演的原型比直接写成一个快的需要编E过的语a来的有意义。有时候发现结果是Perl已经够快了,所以程序变不需要移?更多情Ş是某人可以用C?
一个小的核心程序,~程成动态蝲入的模组或是外部的可执行E序Q然后其它的部分用Perl来完成。这部分的例子可以参?http://waldo.wi.mit.edu/ftp/distribution/software/rhmapper/)?/a>
有一点要的是, Perl 在写作网?CGI 斚w非常优秀Q而且重要性随着各实验将资料发表在网l上之后更是增加。我在基因中心环境下使用 Perl 的经验从头到N是值得U赞的。然而我发现 Perl 也有它的问题。它的松散的E序风格D许多错误Q这些在其它严格的语a都会被抓到。D例来_Perl 让你在一个变数在被指定g前就能用,q是个很有用的特性当你需要的时候,但是却是一个灾隑ֽ你单U的打错了L识名U。同LQ很Ҏ忘记要宣告一个函 式里面的区域变数Q导致不心地改C全域变数?br> 最后,Perl 的不之处在于徏立图形化的用者接口。虽?Unix忠实信徒所有事情都能在命o模式下完成,大多数的l端使用者却不同意。视H,选单Q弹跳的图案已经变成了必要的时尚?/p>
直到最q,直到最q,Perl 的用者界?GUI)发展仍是不成熟的。然?Nick
Ing-Simmons的努力?perlTK(pTK) 的整合得以 Perl 驱动的用者接口在
X-window上面成ؓ可能。我的伙伴和我曾l在 MIT 基因中心写过几个 pTK
为基的应用程序供互连|用者,而且从头到尾都是一个o人满意的l验。其它的基因中心则更大规模的使用 pTKQ在某些地方已经成ؓ主要的生产力?/p>
撰稿人:黄英?Q解攑ֆ306医院Q? q涛Q清华大学生物信息学研究所Q?/font>
审稿人:孙之荣(清华大学生物信息学研I所Q?/font>
1 概述
5 分子q化