隨筆-95  評論-31  文章-10  trackbacks-0
          這是最基礎的入門算法,屬于有監督學習,主要用途進行分類

          流程
          1:獲取樣本數據集(包括分類標簽和特征屬性值)
          2:獲取待預測數據集的特征值,通過與樣本數據集的特征進行比較
          3:然后算法提取樣本集中特征最相似數據的分類標簽
          4:一般只提取樣本數據集中前K個最相似的數據分類標簽,這就是k-鄰近算法的出處,通常k是不大于20的整數
          5:最后從K數據里面提取出現次數最多的分類標簽,作為待預測數據集的分類標簽,即完成實際分類業務

          通俗說法
          1:拿一堆水果
          2:拿一個未知水果
          3:根據未知水果的特征與每一種水果的特征進行比較
          4:取出最相似的前K個水果,這個K通常是不大于20的整數
          5:從這K個水果里面,提取出出現次數最多的水果A
          6:把這個未知水果歸結為水果A
          7:完成分類
          posted on 2017-08-01 12:02 朔望魔刃 閱讀(153) 評論(0)  編輯  收藏 所屬分類: python

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          主站蜘蛛池模板: 横山县| 乌拉特中旗| 房产| 科技| 文昌市| 同德县| 昌平区| 巴里| 遂溪县| 荔波县| 孟津县| 上杭县| 苏尼特右旗| 大渡口区| 息烽县| 恩施市| 龙海市| 贡嘎县| 沅陵县| 中西区| 于都县| 静宁县| 海宁市| 青海省| 万载县| 大新县| 建水县| 泊头市| 牡丹江市| 台江县| 同江市| 宜丰县| 郧西县| 四会市| 灵山县| 湖口县| 长子县| 洛南县| 商城县| 依安县| 中卫市|