posts - 431,  comments - 344,  trackbacks - 0

          rcdk, 是在R下面集成了CDK工具包,以此來通過CDK生成的化學性質數據進行更深層次的統計分析,下面來看看在rcdk中如何進行多個化合物結構的聚類。

          首先需要在R下面安裝rcdk程序包,然后就可以進入命令行,進行如下操作:
          >library("rcdk")   //加載包
          >mols <- load.molecules("mymols.sdf")  //讀取sdf文件
          > fps <- lapply(mols, get.fingerprint, type="extended")  //生產fingerprint值
          > fp.sim <- fp.sim.matrix(fps, method="tanimoto")   //建立矩陣
          > fp.dist <- 1-fp.sim
          > clustering <- hclust(as.dist(fp.dist))
          > plot(clustering)

          執行到這里,我們就得到了結果,如下圖:

          這里我選擇的是50個化合物結構進行處理。是不是很方便~:)
          posted on 2011-04-11 21:41 周銳 閱讀(952) 評論(0)  編輯  收藏 所屬分類: ChemistryCDKR
          主站蜘蛛池模板: 红河县| 张家口市| 洪江市| 瑞安市| 綦江县| 乌兰浩特市| 青海省| 车致| 普兰店市| 湘潭市| 莫力| 沽源县| 梅河口市| 石家庄市| 海盐县| 嘉禾县| 白河县| 江川县| 浦县| 车致| 中山市| 福安市| 庆城县| 龙口市| 河南省| 柳河县| 富平县| 广州市| 安新县| 合肥市| 冀州市| 深水埗区| 平江县| 昔阳县| 德州市| 灵山县| 灌阳县| 河西区| 大城县| 抚宁县| 阳曲县|