一路拾遺
          Collect By Finding All The Way ......
          posts - 81,comments - 41,trackbacks - 0
          文本聚類是搜索引擎和語義web的基本技術(shù),本文簡(jiǎn)單的文本聚類算法,對(duì)于想學(xué)搜索技術(shù)的初學(xué)者有一定入門作用的。這里會(huì)用到TF/IDF權(quán)重,用余弦夾角計(jì)算文本相似度,用方差計(jì)算兩個(gè)數(shù)據(jù)間歐式距離,用k-means進(jìn)行數(shù)據(jù)聚類等數(shù)學(xué)和統(tǒng)計(jì)知識(shí)。
          posted on 2008-08-23 16:54 胖胖泡泡 閱讀(141) 評(píng)論(0)  編輯  收藏

          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 崇阳县| 鸡泽县| 张家港市| 苍山县| 张掖市| 枝江市| 雷州市| 开江县| 南澳县| 浮梁县| 阜平县| 仲巴县| 保康县| 大化| 武汉市| 奇台县| 滕州市| 凯里市| 松原市| 威远县| 台湾省| 全南县| 丹棱县| 若羌县| 咸宁市| 奉节县| 泾源县| 五家渠市| 调兵山市| 沛县| 高安市| 南汇区| 台东县| 高清| 同仁县| 汤阴县| 绥芬河市| 辽源市| 绥阳县| 萍乡市| 上栗县|