馬可波羅的夢鄉

          BlogJava 首頁 新隨筆 聯系 聚合 管理
            4 Posts :: 50 Stories :: 2 Comments :: 0 Trackbacks

          1、Weka中所有的學習算法都繼承自weka.classifiers.Classifier。基本分類器十分簡單,一個程序用于從訓練數據創建分類器,另一個程序則通過未知數據來驗證生成模型,或者為所有的類生成概率分布
          2、數據串行化需要實現Serializable接口,可以把對象串行化到持久存儲中,還沒怎么用過,除了做Eclipse插件時修改過。存儲時,還可以選擇壓縮存儲。
          3、把所有的數據放在Instance中。weka有Instance類,里面還有各種Attribute。有點像Lucene的Document類可以有多個Field一樣。
          4、ARFF是表達包含相互獨立、沒有次序關系數據實例數據集的一種標準方式。(在Weka中應該是大量使用這種數據格式)。ARFF文件只給出dataset,并沒有說明需要通過哪些屬性預測另外哪個屬性。這說明,通過同一個文件,可以研究哪些屬性可以較好地預測另外一個屬性,也可以研究關聯規則,或進行聚類操作
          @data 表示要開始給出數據集的數據實例了
          數據實例中,值通過逗號進行分隔。如果某個值是缺失的,則用一個問號表示
          ARFF允許使用兩種類型的數據,分別是名詞和數值類型

          5、
          posted on 2009-10-16 13:41 夢回唐朝 閱讀(187) 評論(0)  編輯  收藏 所屬分類: weka

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 福泉市| 米林县| 洪洞县| 江西省| 漳州市| 格尔木市| 桐柏县| 北川| 镇宁| 时尚| 集贤县| 惠东县| 修武县| 麻城市| 平阴县| 江西省| 永和县| 宜兰县| 北碚区| 郸城县| 哈尔滨市| 股票| 保山市| 慈溪市| 津南区| 苍梧县| 普兰店市| 崇礼县| 安丘市| 甘肃省| 同江市| 达日县| 普兰店市| 水富县| 淮南市| 江津市| 易门县| 太白县| 榆林市| 天峻县| 秀山|