隨筆-28  評論-51  文章-10  trackbacks-0
          聚類算法研究
          北大ppt 文本挖掘技術系列之二---TextMining03-檢索part1      摘要: 文本檢索技術摘要  閱讀全文
          posted @ 2008-06-12 23:12 fullfocus 閱讀(2581) | 評論 (4)  編輯
          focus聚類研究系列一-----熟悉現有項目基礎(站在巨人的肩膀上)      摘要: 從現在開始,開始我真正的研究計劃:聚類獲取有價值的信息。
          今天開始詳細了解了已有的資源和項目代碼,包含中文分詞,文檔向量化,現有的KA+K-MEANS聚類算法。但是據觀察,聚類效果上不是很滿意,主要是類簇的關鍵字抽取不夠準確,特征選擇尚未考慮,聚類精度需要提高。
          以下是現有系統的流程圖:明天開始到下周末,研究
          1.ka+k-means,其他k-means方法,找出系統不足點
          2.研究特征選擇方法,提高聚類前數據的質量  閱讀全文
          posted @ 2008-05-09 22:22 fullfocus 閱讀(643) | 評論 (2)  編輯
          K-MEANS,AHC, single path直觀演示---Clustering Web Search Results      摘要: K-MEANS,AHC, single path直觀演示---Clustering Web Search Results  閱讀全文
          posted @ 2008-05-08 15:21 fullfocus 閱讀(637) | 評論 (0)  編輯
          TF-IDF解釋      摘要: google的數學之美 系列九 -- 如何確定網頁和查詢的相關性
          主要講解TF-IDF技術,與判斷查詢相關性。  閱讀全文
          posted @ 2008-05-07 15:38 fullfocus 閱讀(2611) | 評論 (0)  編輯
          召回率與精度      摘要: 一直搞不清搜索引擎的查全率和查準率是什么意思,只知道這兩個是衡量一個搜索引擎性能的. 今個 看一篇 南大的學士論文的時候, 又碰到這個問題. 所以決定把他搞清楚, 上百度搜了一下, 所獲很多.   閱讀全文
          posted @ 2008-05-07 14:35 fullfocus 閱讀(2378) | 評論 (4)  編輯

          主站蜘蛛池模板: 藁城市| 古蔺县| 东乡族自治县| 中江县| 彩票| 鞍山市| 砀山县| 林西县| 罗山县| 岳阳县| 章丘市| 大化| 越西县| 安福县| 闽侯县| 麦盖提县| 怀来县| 山东省| 阳原县| 滨州市| 长武县| 铜鼓县| 乐山市| 尉犁县| 丹阳市| 阳西县| 赫章县| 大港区| 临湘市| 临邑县| 平乐县| 青神县| 华坪县| 芦山县| 西林县| 寻乌县| 高阳县| 太白县| 商丘市| 杭锦旗| 香格里拉县|