隨筆-95  評論-31  文章-10  trackbacks-0
          這是最基礎的入門算法,屬于有監督學習,主要用途進行分類

          流程
          1:獲取樣本數據集(包括分類標簽和特征屬性值)
          2:獲取待預測數據集的特征值,通過與樣本數據集的特征進行比較
          3:然后算法提取樣本集中特征最相似數據的分類標簽
          4:一般只提取樣本數據集中前K個最相似的數據分類標簽,這就是k-鄰近算法的出處,通常k是不大于20的整數
          5:最后從K數據里面提取出現次數最多的分類標簽,作為待預測數據集的分類標簽,即完成實際分類業務

          通俗說法
          1:拿一堆水果
          2:拿一個未知水果
          3:根據未知水果的特征與每一種水果的特征進行比較
          4:取出最相似的前K個水果,這個K通常是不大于20的整數
          5:從這K個水果里面,提取出出現次數最多的水果A
          6:把這個未知水果歸結為水果A
          7:完成分類
          posted on 2017-08-01 12:02 朔望魔刃 閱讀(158) 評論(0)  編輯  收藏 所屬分類: python

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 洪湖市| 龙游县| 宁都县| 隆安县| 察隅县| 北安市| 高唐县| 高要市| 陆良县| 雅江县| 东阳市| 寿宁县| 泸西县| 红河县| 贵州省| 屏东市| 北辰区| 墨竹工卡县| 白水县| 东安县| 夏津县| 阳原县| 丘北县| 海阳市| 图木舒克市| 仙居县| 洱源县| 肇源县| 绥江县| 蛟河市| 桂平市| 天气| 辽源市| 临澧县| 青海省| 历史| 关岭| 石狮市| 江西省| 邵武市| 沁水县|