在剛剛結(jié)束的的WWW2008的會議中,有篇超短的paper 《Size Matters: Word Count as a Measure of Quality on Wikipedia》,這篇文章針對Wikipedia的質(zhì)量的評估,提出了一種方法來評估一個(gè)Wikipedia文章的質(zhì)量,這種方法很簡單,就是數(shù)文章字?jǐn)?shù)(Word Count)。
作者認(rèn)為這種方法的好處有如下幾點(diǎn):
1.文章的長度很容易測量;
2.許多其他的方法需要一些其他的信息,而這些信息不是很容易得到;
3.許多其他的方式對用戶來說不容易理解;
4.文章的長度評估的方法比其他的復(fù)雜的方法更有意義。
(說的好像是一點(diǎn)簡單^_^)這確實(shí)是一種簡單的方法,但是效率怎么樣?根據(jù)作者的實(shí)驗(yàn),這個(gè)方法在二個(gè)分類(featured and random)的情況下能得到96.3%的準(zhǔn)確率。
當(dāng)然,作者也比較實(shí)事求是,也不會夸大這種方法的作用,作者將尋找新的方法來評估Wikipedia文章質(zhì)量。
除了這篇文章,其實(shí)還有其他幾種方法,可以參看下面這些論文:
1.Information Quality Discussion in Wikipedia
2.Assessing Information Quality of a Community-Base Encyclopedia
4.Wikipedia Article Quality Assessment and Ranking Tips for Users and Search Engine Engineers
這些文章雖然都是關(guān)于wiki質(zhì)量討論的,但是研究的意義很重大。特別是針對目前網(wǎng)絡(luò)的信息泛濫的情況下,需要用一種方式來評估信息的有用性,這樣可以讓我們更輕松找到我們需要的有用信息,同樣搜索引擎如果能判斷提供給我們的文章的質(zhì)量好壞,這也就免去了我們很多時(shí)間去挑選了。
對于推薦系統(tǒng)(如新聞、文章推薦系統(tǒng)),用戶很少評分的情況下,可以采用這種方法自動給項(xiàng)目評分。