一路拾遺
          Collect By Finding All The Way ......
          posts - 81,comments - 41,trackbacks - 0
          文本聚類是搜索引擎和語(yǔ)義web的基本技術(shù),本文簡(jiǎn)單的文本聚類算法,對(duì)于想學(xué)搜索技術(shù)的初學(xué)者有一定入門(mén)作用的。這里會(huì)用到TF/IDF權(quán)重,用余弦?jiàn)A角計(jì)算文本相似度,用方差計(jì)算兩個(gè)數(shù)據(jù)間歐式距離,用k-means進(jìn)行數(shù)據(jù)聚類等數(shù)學(xué)和統(tǒng)計(jì)知識(shí)。
          posted on 2008-08-23 16:54 胖胖泡泡 閱讀(143) 評(píng)論(0)  編輯  收藏

          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 神池县| 新乡县| 东阳市| 正宁县| 淮滨县| 綦江县| 玉环县| 满洲里市| 磐石市| 湄潭县| 湘潭市| 儋州市| 兴文县| 曲靖市| 台北县| 萨嘎县| 朝阳区| 唐海县| 玛纳斯县| 高碑店市| 宽城| 洪雅县| 五莲县| 定远县| 沁源县| 会东县| 垦利县| 富平县| 双牌县| 岳普湖县| 揭西县| 庆元县| 浦县| 盐池县| 虎林市| 湘潭市| 毕节市| 石阡县| 日喀则市| 遵化市| 丰台区|