隨筆-95  評論-31  文章-10  trackbacks-0
          這是最基礎的入門算法,屬于有監督學習,主要用途進行分類

          流程
          1:獲取樣本數據集(包括分類標簽和特征屬性值)
          2:獲取待預測數據集的特征值,通過與樣本數據集的特征進行比較
          3:然后算法提取樣本集中特征最相似數據的分類標簽
          4:一般只提取樣本數據集中前K個最相似的數據分類標簽,這就是k-鄰近算法的出處,通常k是不大于20的整數
          5:最后從K數據里面提取出現次數最多的分類標簽,作為待預測數據集的分類標簽,即完成實際分類業務

          通俗說法
          1:拿一堆水果
          2:拿一個未知水果
          3:根據未知水果的特征與每一種水果的特征進行比較
          4:取出最相似的前K個水果,這個K通常是不大于20的整數
          5:從這K個水果里面,提取出出現次數最多的水果A
          6:把這個未知水果歸結為水果A
          7:完成分類
          posted on 2017-08-01 12:02 朔望魔刃 閱讀(158) 評論(0)  編輯  收藏 所屬分類: python

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 石城县| 金湖县| 昌邑市| 宁河县| 连南| 读书| 长葛市| 介休市| 安仁县| 阜宁县| 普宁市| 伊吾县| 桐庐县| 梁山县| 安仁县| 丰都县| 镇康县| 田东县| 霍山县| 长岭县| 农安县| 台北市| 金堂县| 泗洪县| 乃东县| 沈丘县| 建德市| 奉节县| 张家港市| 拉孜县| 观塘区| 遂溪县| 紫云| 象山县| 衡东县| 博乐市| 喀喇| 宝山区| 六安市| 凤台县| 射阳县|