無為

          無為則可為,無為則至深!

            BlogJava :: 首頁 :: 聯系 :: 聚合  :: 管理
            190 Posts :: 291 Stories :: 258 Comments :: 0 Trackbacks

          為闡述單個變量的分布函數的求法,首先講一個擲圖釘的例子:設擲為頭的可能性是 t, 那么 t 的可能性概率分布函數 P(t| ξ ) 。那么下一次擲為頭的概率是 P(x=heads| ξ )= p(x=heads|t, ξ )p(t| ξ )dt= t*p(t| ξ )dt=E(t| ξ ) 。而且,進一步地如果擲為頭后的 t 的分布概率就為 p(t| x=heads, ξ )=c* p(x=heads|t, ξ )* p(t| ξ )=c*t* p(t| ξ ). 這樣的話 p(t|m heads ,n tails , ξ )=c*t(m)*(1-t)(n)* p(t| ξ ) [ 其中 t(m) 表示 t m 次方 ] ,也就求得 m 次擲為“頭”, n 次擲為尾后的 t 的概率分布情況。上面的是對于兩個結果的情況的分析,那么對于離散的多種結果的情況,我們可以用同樣的方法進行分析。下面講怎么樣用貝葉斯方法來進行分類。

          定義:如果 K 為屬性的個數, D 定義為含有 K 個值的向量。表示為 D=(x1=v1,x2=v2,….xk=vk), 其中 x 為屬性, v 為屬性值。一個 Concept 定義為相似記錄的集合, Concept C 定義為 K 個可能的屬性值的分布函數的向量。表示為 C=(f1,f2,…fk) 。這里 fk 是一個分布函數,它由在這個 Concept 里第 k 個屬性的所有屬性值決定。例如, vk1,vk2,….vkN N 個記錄 D1,D2…DN 的第 k 個屬性值 , 那么 fk 可能的分布函數是 fk(xk|D1…DN)=Mk*exp{-(xk-ak)*(xk-ak)/2 б k* бk } .

          定義 H=(C1,C2…,CJ) 為所有各種分類集合的集合。對于新的一個記錄 D, 如果 Cj 為那個接受 D 的那一類, Hj 為接受了以后變化了的 H, 那么衡量 Cj 接受 D 的好壞就由 P(Hj|DH)=P(Hj|H)P(D|HjH)/P(D|H) 來決定,它的最大值也就對應哪個最適合的 Cj 。假定 P(Hj|H) 對于每一個 j 都是相等的,那么我們只需要比較 P(D|HjH) 。而 P(D|HjH) =P(Cj|HjH)*

          P(D|CjHjH)=|Cj|/|C|*P(D|Cj),P(D|Cj)

          表示 D 屬于 Cj 的程度。這里 |C| 表示 C 中記錄的個數。, P(D|C)= П P( vk|fk ) 對于連續變量, P(vk|fk)=fk(vk) ? xk, 這兒 ? xk vk 周圍很小的一個常量范圍。對于離散變量, P(vk|fk)=C 中第 k 個屬性值是 vk 的個數 /C 中記錄的個數。

          凡是有該標志的文章,都是該blog博主Caoer(草兒)原創,凡是索引、收藏
          、轉載請注明來處和原文作者。非常感謝。

          posted on 2006-06-10 14:03 草兒 閱讀(297) 評論(0)  編輯  收藏 所屬分類: BI and DM
          主站蜘蛛池模板: 炉霍县| 灵台县| 普洱| 格尔木市| 文化| 新晃| 宜州市| 贵德县| 延边| 景泰县| 盐城市| 泰来县| 昌邑市| 静安区| 信宜市| 驻马店市| 弋阳县| 阳谷县| 新建县| 商都县| 平利县| 宿州市| 观塘区| 广安市| 大埔县| 库伦旗| 八宿县| 繁峙县| 吴旗县| 穆棱市| 屏山县| 隆尧县| 鲁山县| 盐津县| 板桥市| 承德市| 阿巴嘎旗| 福州市| 金溪县| 奉化市| 蚌埠市|