隨筆-28  評論-51  文章-10  trackbacks-0
          北大ppt 文本挖掘技術系列之五--TextMining05-聚類



          聚類概述

          概念

           

           

           

           

          應用

           

           

           

           

          步驟

           

           

           

           

          評價

           

           

           

           

          聚類準則函數

           

           

           

           

          聚類算法

          [文檔間距離,類間距離]

          劃分方法

          K-means [分析,缺陷,改進]

           

           

           

           

          K-mediods[PAM算法,CLARA算法,CLARANS算法]

           

           

           

           


          層次方法

          凝聚

          AGNES (1990)

          改進的層次聚類

          1.       Birch

          2.       CURE

          3.       ROCK

          4.       Chameleon


          單鏈接,全連接,組平均鏈接


          分裂

          DIANA (1990)

           

          密度方法

          DBSCAN

           

           

           

          OPTICS

           

           

           

          DENCLUE

           

           

           

          CLIQUE

           

           

           

           


          網格方法

          CLIQUE

           

           

           

           


          (孤立點分析)

          基于統計

           

           

           

          基于距離

           

           

           

          基于偏離

           

           

           

          在線聚類 STC

           

           

           

           

          注:對k-means的改進版介紹比較詳細,另外對STC部分分析比較深刻,看來下階段我需要身體力行下,看看STC的效果。邊做邊看論文吧,哈哈
          http://www.aygfsteel.com/Files/fullfocus/05.pdf

          posted on 2008-06-18 22:13 fullfocus 閱讀(1836) 評論(0)  編輯  收藏 所屬分類: 聚類算法研究
          主站蜘蛛池模板: 简阳市| 扎兰屯市| 内江市| 许昌县| 土默特左旗| 神池县| 怀宁县| 桦川县| 洮南市| 邢台市| 手机| 延长县| 南部县| 平原县| 木兰县| 瑞丽市| 长岭县| 黔西县| 交城县| 南投县| 泸州市| 巴彦县| 自治县| 茶陵县| 科尔| 四平市| 江门市| 班戈县| 玛沁县| 凉城县| 抚远县| 吉水县| 太和县| 开封市| 治县。| 阿拉善右旗| 淮阳县| 黑龙江省| 读书| 遵义市| 金湖县|