qiyadeng

          專注于Java示例及教程
          posts - 84, comments - 152, trackbacks - 0, articles - 34

          Measure the Quality of Wikipedia

          Posted on 2008-05-08 13:07 qiyadeng 閱讀(1170) 評論(0)  編輯  收藏

            在剛剛結(jié)束的的WWW2008的會議中,有篇超短的paper 《Size Matters: Word Count as a Measure of Quality on Wikipedia》,這篇文章針對Wikipedia的質(zhì)量的評估,提出了一種方法來評估一個(gè)Wikipedia文章的質(zhì)量,這種方法很簡單,就是數(shù)文章字?jǐn)?shù)(Word Count)。

          作者認(rèn)為這種方法的好處有如下幾點(diǎn):

          1.文章的長度很容易測量;

          2.許多其他的方法需要一些其他的信息,而這些信息不是很容易得到;

          3.許多其他的方式對用戶來說不容易理解;

          4.文章的長度評估的方法比其他的復(fù)雜的方法更有意義。

          (說的好像是一點(diǎn)簡單^_^)這確實(shí)是一種簡單的方法,但是效率怎么樣?根據(jù)作者的實(shí)驗(yàn),這個(gè)方法在二個(gè)分類(featured and random)的情況下能得到96.3%的準(zhǔn)確率。

          當(dāng)然,作者也比較實(shí)事求是,也不會夸大這種方法的作用,作者將尋找新的方法來評估Wikipedia文章質(zhì)量。

          除了這篇文章,其實(shí)還有其他幾種方法,可以參看下面這些論文:

          1.Information Quality Discussion in Wikipedia

          2.Assessing Information Quality of a Community-Base Encyclopedia

          3.Measuring Wikipedia

          4.Wikipedia Article Quality Assessment and Ranking Tips for Users and Search Engine Engineers

            這些文章雖然都是關(guān)于wiki質(zhì)量討論的,但是研究的意義很重大。特別是針對目前網(wǎng)絡(luò)的信息泛濫的情況下,需要用一種方式來評估信息的有用性,這樣可以讓我們更輕松找到我們需要的有用信息,同樣搜索引擎如果能判斷提供給我們的文章的質(zhì)量好壞,這也就免去了我們很多時(shí)間去挑選了。

          對于推薦系統(tǒng)(如新聞、文章推薦系統(tǒng)),用戶很少評分的情況下,可以采用這種方法自動給項(xiàng)目評分。


          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 黑水县| 将乐县| 社旗县| 阿瓦提县| 蓬安县| 邯郸县| 通山县| 嘉禾县| 团风县| 子长县| 博客| 南丹县| 广州市| 怀来县| 石阡县| 乌恰县| 霞浦县| 吉首市| 专栏| 公安县| 双桥区| 岚皋县| 河间市| 营口市| 伊春市| 盘山县| 板桥市| 阿荣旗| 密山市| 运城市| 武夷山市| 丹阳市| 大安市| 正蓝旗| 博湖县| 奉节县| 灌云县| 堆龙德庆县| 大渡口区| 罗定市| 财经|