隨筆-28  評論-51  文章-10  trackbacks-0
          北大ppt 文本挖掘技術系列之五--TextMining05-聚類



          聚類概述

          概念

           

           

           

           

          應用

           

           

           

           

          步驟

           

           

           

           

          評價

           

           

           

           

          聚類準則函數

           

           

           

           

          聚類算法

          [文檔間距離,類間距離]

          劃分方法

          K-means [分析,缺陷,改進]

           

           

           

           

          K-mediods[PAM算法,CLARA算法,CLARANS算法]

           

           

           

           


          層次方法

          凝聚

          AGNES (1990)

          改進的層次聚類

          1.       Birch

          2.       CURE

          3.       ROCK

          4.       Chameleon


          單鏈接,全連接,組平均鏈接


          分裂

          DIANA (1990)

           

          密度方法

          DBSCAN

           

           

           

          OPTICS

           

           

           

          DENCLUE

           

           

           

          CLIQUE

           

           

           

           


          網格方法

          CLIQUE

           

           

           

           


          (孤立點分析)

          基于統計

           

           

           

          基于距離

           

           

           

          基于偏離

           

           

           

          在線聚類 STC

           

           

           

           

          注:對k-means的改進版介紹比較詳細,另外對STC部分分析比較深刻,看來下階段我需要身體力行下,看看STC的效果。邊做邊看論文吧,哈哈
          http://www.aygfsteel.com/Files/fullfocus/05.pdf

          posted on 2008-06-18 22:13 fullfocus 閱讀(1842) 評論(0)  編輯  收藏 所屬分類: 聚類算法研究
          主站蜘蛛池模板: 绥江县| 临城县| 乌鲁木齐县| 普兰县| 司法| 武穴市| 铜鼓县| 云林县| 临颍县| 南投县| 汕尾市| 古浪县| 梁山县| 涪陵区| 宜城市| 陇川县| 兴义市| 西青区| 杭锦旗| 江山市| 赣榆县| 建宁县| 东台市| 横峰县| 满城县| 瓮安县| 黄陵县| 区。| 宁阳县| 洛南县| 龙里县| 铜山县| 汉寿县| 广西| 连江县| 鹤峰县| 四川省| 修文县| 高雄市| 巩义市| 扶风县|