posts - 431,  comments - 344,  trackbacks - 0

          rcdk, 是在R下面集成了CDK工具包,以此來通過CDK生成的化學性質數據進行更深層次的統計分析,下面來看看在rcdk中如何進行多個化合物結構的聚類。

          首先需要在R下面安裝rcdk程序包,然后就可以進入命令行,進行如下操作:
          >library("rcdk")   //加載包
          >mols <- load.molecules("mymols.sdf")  //讀取sdf文件
          > fps <- lapply(mols, get.fingerprint, type="extended")  //生產fingerprint值
          > fp.sim <- fp.sim.matrix(fps, method="tanimoto")   //建立矩陣
          > fp.dist <- 1-fp.sim
          > clustering <- hclust(as.dist(fp.dist))
          > plot(clustering)

          執行到這里,我們就得到了結果,如下圖:

          這里我選擇的是50個化合物結構進行處理。是不是很方便~:)
          posted on 2011-04-11 21:41 周銳 閱讀(952) 評論(0)  編輯  收藏 所屬分類: ChemistryCDKR
          主站蜘蛛池模板: 定边县| 博兴县| 阿克陶县| 岑巩县| 凯里市| 招远市| 西城区| 西昌市| 永泰县| 安顺市| 晋江市| 泗水县| 永德县| 南开区| 宁陵县| 沅江市| 金昌市| 外汇| 榆社县| 新乡县| 新蔡县| 霞浦县| 阳谷县| 五常市| 忻州市| 南华县| 浠水县| 丹东市| 雷波县| 上犹县| 屯门区| 仪陇县| 高碑店市| 宁南县| 长治市| 鄂州市| 榆中县| 廊坊市| 合川市| 伊通| 承德市|