隨筆-95  評論-31  文章-10  trackbacks-0
          這是最基礎的入門算法,屬于有監督學習,主要用途進行分類

          流程
          1:獲取樣本數據集(包括分類標簽和特征屬性值)
          2:獲取待預測數據集的特征值,通過與樣本數據集的特征進行比較
          3:然后算法提取樣本集中特征最相似數據的分類標簽
          4:一般只提取樣本數據集中前K個最相似的數據分類標簽,這就是k-鄰近算法的出處,通常k是不大于20的整數
          5:最后從K數據里面提取出現次數最多的分類標簽,作為待預測數據集的分類標簽,即完成實際分類業務

          通俗說法
          1:拿一堆水果
          2:拿一個未知水果
          3:根據未知水果的特征與每一種水果的特征進行比較
          4:取出最相似的前K個水果,這個K通常是不大于20的整數
          5:從這K個水果里面,提取出出現次數最多的水果A
          6:把這個未知水果歸結為水果A
          7:完成分類
          posted on 2017-08-01 12:02 朔望魔刃 閱讀(153) 評論(0)  編輯  收藏 所屬分類: python

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 嘉荫县| 和顺县| 汕尾市| 福海县| 大邑县| 吴江市| 古蔺县| 饶平县| 盐池县| 临武县| 泾阳县| 凌云县| 襄垣县| 邻水| 新绛县| 双牌县| 大石桥市| 石泉县| 慈溪市| 都江堰市| 穆棱市| 连平县| 石柱| 伊金霍洛旗| 文成县| 汕尾市| 普格县| 尼勒克县| 农安县| 龙口市| 沾化县| 驻马店市| 平远县| 鄂州市| 济南市| 临猗县| 隆化县| 疏附县| 晋宁县| 内黄县| 临汾市|