隨筆-28  評論-51  文章-10  trackbacks-0
          從現在開始,開始我真正的研究計劃:聚類獲取有價值的信息。
          今天開始詳細了解了已有的資源和項目代碼,包含中文分詞,文檔向量化,現有的KA+K-MEANS聚類算法。但是據觀察,聚類效果上不是很滿意,主要是類簇的關鍵字抽取不夠準確,特征選擇尚未考慮,聚類精度需要提高。
          以下是現有系統的流程圖:明天開始到下周末,研究
          1.ka+k-means,其他k-means方法,找出系統不足點
          2.研究特征選擇方法,提高聚類前數據的質量




          posted on 2008-05-09 22:22 fullfocus 閱讀(643) 評論(2)  編輯  收藏 所屬分類: 聚類算法研究

          評論:
          # re: focus聚類研究系列一-----熟悉現有項目基礎(站在巨人的肩膀上) 2008-08-08 13:32 | zr
          請問這是什么系統啊,是對網頁的聚類嗎  回復  更多評論
            
          # re: focus聚類研究系列一-----熟悉現有項目基礎(站在巨人的肩膀上)[未登錄] 2010-06-10 16:31 | Bill
          怎么判斷關鍵詞抽取不夠精確呢?請樓主說說你的依據  回復  更多評論
            
          主站蜘蛛池模板: 陈巴尔虎旗| 开阳县| 靖宇县| 吉水县| 巴里| 扶绥县| 台中市| 屯留县| 赤城县| 稷山县| 沙雅县| 台南市| 四会市| 宁陕县| 德兴市| 宁城县| 呈贡县| 龙泉市| 江安县| 梨树县| 会东县| 湘西| 蛟河市| 布拖县| 周至县| 山西省| 得荣县| 丹寨县| 宿迁市| 沂源县| 安乡县| 揭东县| 蓬安县| 北碚区| 宜丰县| 锡林浩特市| 鹿邑县| 西乌珠穆沁旗| 应城市| 宁陵县| 文化|