隨筆-28  評(píng)論-51  文章-10  trackbacks-0
          從現(xiàn)在開始,開始我真正的研究計(jì)劃:聚類獲取有價(jià)值的信息。
          今天開始詳細(xì)了解了已有的資源和項(xiàng)目代碼,包含中文分詞,文檔向量化,現(xiàn)有的KA+K-MEANS聚類算法。但是據(jù)觀察,聚類效果上不是很滿意,主要是類簇的關(guān)鍵字抽取不夠準(zhǔn)確,特征選擇尚未考慮,聚類精度需要提高。
          以下是現(xiàn)有系統(tǒng)的流程圖:明天開始到下周末,研究
          1.ka+k-means,其他k-means方法,找出系統(tǒng)不足點(diǎn)
          2.研究特征選擇方法,提高聚類前數(shù)據(jù)的質(zhì)量




          posted on 2008-05-09 22:22 fullfocus 閱讀(644) 評(píng)論(2)  編輯  收藏 所屬分類: 聚類算法研究

          評(píng)論:
          # re: focus聚類研究系列一-----熟悉現(xiàn)有項(xiàng)目基礎(chǔ)(站在巨人的肩膀上) 2008-08-08 13:32 | zr
          請(qǐng)問這是什么系統(tǒng)啊,是對(duì)網(wǎng)頁的聚類嗎  回復(fù)  更多評(píng)論
            
          # re: focus聚類研究系列一-----熟悉現(xiàn)有項(xiàng)目基礎(chǔ)(站在巨人的肩膀上)[未登錄] 2010-06-10 16:31 | Bill
          怎么判斷關(guān)鍵詞抽取不夠精確呢?請(qǐng)樓主說說你的依據(jù)  回復(fù)  更多評(píng)論
            
          主站蜘蛛池模板: 庆云县| 桂东县| 金阳县| 吉安市| 浦江县| 威宁| 东光县| 高邮市| 九江市| 绩溪县| 连江县| 景洪市| 枣庄市| 苗栗县| 黔西县| 双鸭山市| 凤城市| 深圳市| 清徐县| 睢宁县| 周至县| 松桃| 苏州市| 南岸区| 东丽区| 五常市| 谷城县| 石泉县| 敦煌市| 东乡族自治县| 昭通市| 宾川县| 皮山县| 会理县| 府谷县| 胶南市| 临泉县| 海晏县| 施甸县| 宁海县| 府谷县|