隨筆-28  評論-51  文章-10  trackbacks-0
          北大ppt 文本挖掘技術系列之五--TextMining05-聚類



          聚類概述

          概念

           

           

           

           

          應用

           

           

           

           

          步驟

           

           

           

           

          評價

           

           

           

           

          聚類準則函數

           

           

           

           

          聚類算法

          [文檔間距離,類間距離]

          劃分方法

          K-means [分析,缺陷,改進]

           

           

           

           

          K-mediods[PAM算法,CLARA算法,CLARANS算法]

           

           

           

           


          層次方法

          凝聚

          AGNES (1990)

          改進的層次聚類

          1.       Birch

          2.       CURE

          3.       ROCK

          4.       Chameleon


          單鏈接,全連接,組平均鏈接


          分裂

          DIANA (1990)

           

          密度方法

          DBSCAN

           

           

           

          OPTICS

           

           

           

          DENCLUE

           

           

           

          CLIQUE

           

           

           

           


          網格方法

          CLIQUE

           

           

           

           


          (孤立點分析)

          基于統計

           

           

           

          基于距離

           

           

           

          基于偏離

           

           

           

          在線聚類 STC

           

           

           

           

          注:對k-means的改進版介紹比較詳細,另外對STC部分分析比較深刻,看來下階段我需要身體力行下,看看STC的效果。邊做邊看論文吧,哈哈
          http://www.aygfsteel.com/Files/fullfocus/05.pdf

          posted on 2008-06-18 22:13 fullfocus 閱讀(1836) 評論(0)  編輯  收藏 所屬分類: 聚類算法研究
          主站蜘蛛池模板: 建始县| 保德县| 成武县| 岱山县| 福鼎市| 仁化县| 大化| 西安市| 德江县| 商丘市| 肥西县| 敦化市| 吴桥县| 玉龙| 鹤峰县| 娄烦县| 屏山县| 乌兰察布市| 宜章县| 乌拉特中旗| 靖远县| 宜丰县| 建水县| 曲沃县| 梓潼县| 连山| 徐水县| 浦城县| 修文县| 时尚| 秦皇岛市| 吉水县| 阜南县| 古丈县| 扶沟县| 敦化市| 行唐县| 金堂县| 惠州市| 香河县| 武威市|