隨筆-28  評論-51  文章-10  trackbacks-0
          北大ppt 文本挖掘技術系列之五--TextMining05-聚類



          聚類概述

          概念

           

           

           

           

          應用

           

           

           

           

          步驟

           

           

           

           

          評價

           

           

           

           

          聚類準則函數

           

           

           

           

          聚類算法

          [文檔間距離,類間距離]

          劃分方法

          K-means [分析,缺陷,改進]

           

           

           

           

          K-mediods[PAM算法,CLARA算法,CLARANS算法]

           

           

           

           


          層次方法

          凝聚

          AGNES (1990)

          改進的層次聚類

          1.       Birch

          2.       CURE

          3.       ROCK

          4.       Chameleon


          單鏈接,全連接,組平均鏈接


          分裂

          DIANA (1990)

           

          密度方法

          DBSCAN

           

           

           

          OPTICS

           

           

           

          DENCLUE

           

           

           

          CLIQUE

           

           

           

           


          網格方法

          CLIQUE

           

           

           

           


          (孤立點分析)

          基于統計

           

           

           

          基于距離

           

           

           

          基于偏離

           

           

           

          在線聚類 STC

           

           

           

           

          注:對k-means的改進版介紹比較詳細,另外對STC部分分析比較深刻,看來下階段我需要身體力行下,看看STC的效果。邊做邊看論文吧,哈哈
          http://www.aygfsteel.com/Files/fullfocus/05.pdf

          posted on 2008-06-18 22:13 fullfocus 閱讀(1836) 評論(0)  編輯  收藏 所屬分類: 聚類算法研究
          主站蜘蛛池模板: 井冈山市| 成都市| 仁寿县| 彝良县| 武宣县| 合江县| 达日县| 石景山区| 秀山| 鲁山县| 和顺县| 司法| 昌吉市| 资溪县| 呼和浩特市| 同德县| 措勤县| 新乡市| 万全县| 安龙县| 平和县| 平泉县| 河南省| 巴塘县| 海门市| 嘉禾县| 长阳| 平泉县| 建宁县| 锦屏县| 施秉县| 永平县| 庆城县| 山阴县| 绥化市| 鹤岗市| 乌海市| 武威市| 清镇市| 句容市| 萍乡市|