馬可波羅的夢鄉

          BlogJava 首頁 新隨筆 聯系 聚合 管理
            4 Posts :: 50 Stories :: 2 Comments :: 0 Trackbacks

          1、Weka中所有的學習算法都繼承自weka.classifiers.Classifier。基本分類器十分簡單,一個程序用于從訓練數據創建分類器,另一個程序則通過未知數據來驗證生成模型,或者為所有的類生成概率分布
          2、數據串行化需要實現Serializable接口,可以把對象串行化到持久存儲中,還沒怎么用過,除了做Eclipse插件時修改過。存儲時,還可以選擇壓縮存儲。
          3、把所有的數據放在Instance中。weka有Instance類,里面還有各種Attribute。有點像Lucene的Document類可以有多個Field一樣。
          4、ARFF是表達包含相互獨立、沒有次序關系數據實例數據集的一種標準方式。(在Weka中應該是大量使用這種數據格式)。ARFF文件只給出dataset,并沒有說明需要通過哪些屬性預測另外哪個屬性。這說明,通過同一個文件,可以研究哪些屬性可以較好地預測另外一個屬性,也可以研究關聯規則,或進行聚類操作
          @data 表示要開始給出數據集的數據實例了
          數據實例中,值通過逗號進行分隔。如果某個值是缺失的,則用一個問號表示
          ARFF允許使用兩種類型的數據,分別是名詞和數值類型

          5、
          posted on 2009-10-16 13:41 夢回唐朝 閱讀(186) 評論(0)  編輯  收藏 所屬分類: weka

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 定日县| 湄潭县| 图木舒克市| 喀什市| 普安县| 武陟县| 射洪县| 乐清市| 凤冈县| 绥中县| 安远县| 常德市| 长顺县| 安平县| 武川县| 友谊县| 莲花县| 全南县| 泽州县| 清徐县| 天气| 卓尼县| 枣阳市| 周口市| 遂川县| 海门市| 汉沽区| 札达县| 南丰县| 彩票| 通城县| 通道| 杭锦旗| 湖南省| 伊金霍洛旗| 弥渡县| 蒙自县| 萨迦县| 元阳县| 迭部县| 红河县|