隨筆-28 評論-51 文章-10 trackbacks-0

05 2008 檔案

focus聚類研究系列一-----熟悉現有項目基礎（站在巨人的肩膀上）摘要: 從現在開始，開始我真正的研究計劃：聚類獲取有價值的信息。
今天開始詳細了解了已有的資源和項目代碼，包含中文分詞，文檔向量化，現有的KA+K-MEANS聚類算法。但是據觀察，聚類效果上不是很滿意，主要是類簇的關鍵字抽取不夠準確，特征選擇尚未考慮，聚類精度需要提高。
以下是現有系統的流程圖：明天開始到下周末，研究
1.ka+k-means，其他k-means方法，找出系統不足點
2.研究特征選擇方法，提高聚類前數據的質量閱讀全文

posted @ 2008-05-09 22:22 fullfocus 閱讀(653) | 評論 (2) 編輯

K-MEANS,AHC, single path直觀演示---Clustering Web Search Results 摘要: K-MEANS,AHC, single path直觀演示---Clustering Web Search Results 閱讀全文

posted @ 2008-05-08 15:21 fullfocus 閱讀(644) | 評論 (0) 編輯

TF-IDF解釋摘要: google的數學之美系列九 -- 如何確定網頁和查詢的相關性
主要講解TF-IDF技術，與判斷查詢相關性。閱讀全文

posted @ 2008-05-07 15:38 fullfocus 閱讀(2620) | 評論 (0) 編輯

召回率與精度摘要: 一直搞不清搜索引擎的查全率和查準率是什么意思,只知道這兩個是衡量一個搜索引擎性能的. 今個看一篇南大的學士論文的時候, 又碰到這個問題. 所以決定把他搞清楚, 上百度搜了一下, 所獲很多. 閱讀全文

posted @ 2008-05-07 14:35 fullfocus 閱讀(2392) | 評論 (4) 編輯

<

2008年5月

>

日

一

二

三

四

五

六

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

文章檔案

他山之石

beansoft
Spring, Struts, Hibernate, SWT
bidaily
business intelligence
raof01
c/c++ unix
Snowdream
c/c++ unix
邂逅你的TA

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

文章檔案

他山之石

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜