亚洲国产cao,一二三区精品,一区二区三区在线观看视频

按:之前的文章重新匯編一下,修改了一些錯誤和不當的說法，一起復習,然后繼續SVM之旅.

（一）SVM的八股簡介

支持向量機(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的，它在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢，并能夠推廣應用到函數擬合等其他機器學習問題中[10]。
支持向量機方法是建立在統計學習理論的VC 維理論和結構風險最小原理基礎上的，根據有限的樣本信息在模型的復雜性（即對特定訓練樣本的學習精度，Accuracy）和學習能力（即無錯誤地識別任意樣本的能力）之間尋求最佳折衷，以期獲得最好的推廣能力[14]（或稱泛化能力）。

以上是經常被有關SVM 的學術文獻引用的介紹，有點八股，我來逐一分解并解釋一下。

Vapnik是統計機器學習的大牛，這想必都不用說，他出版的《Statistical Learning Theory》是一本完整闡述統計機器學習思想的名著。在該書中詳細的論證了統計機器學習之所以區別于傳統機器學習的本質，就在于統計機器學習能夠精確的給出學習效果，能夠解答需要的樣本數等等一系列問題。與統計機器學習的精密思維相比，傳統的機器學習基本上屬于摸著石頭過河，用傳統的機器學習方法構造分類系統完全成了一種技巧，一個人做的結果可能很好，另一個人差不多的方法做出來卻很差，缺乏指導和原則。

所謂VC維是對函數類的一種度量，可以簡單的理解為問題的復雜程度，VC維越高，一個問題就越復雜。正是因為SVM關注的是VC維，后面我們可以看到，SVM解決問題的時候，和樣本的維數是無關的（甚至樣本是上萬維的都可以，這使得SVM很適合用來解決文本分類的問題，當然，有這樣的能力也因為引入了核函數）。

結構風險最小聽上去文縐縐，其實說的也無非是下面這回事。

機器學習本質上就是一種對問題真實模型的逼近（我們選擇一個我們認為比較好的近似模型，這個近似模型就叫做一個假設），但毫無疑問，真實模型一定是不知道的（如果知道了，我們干嗎還要機器學習？直接用真實模型解決問題不就可以了？對吧，哈哈）既然真實模型不知道，那么我們選擇的假設與問題真實解之間究竟有多大差距，我們就沒法得知。比如說我們認為宇宙誕生于150億年前的一場大爆炸，這個假設能夠描述很多我們觀察到的現象，但它與真實的宇宙模型之間還相差多少？誰也說不清，因為我們壓根就不知道真實的宇宙模型到底是什么。

這個與問題真實解之間的誤差，就叫做風險（更嚴格的說，誤差的累積叫做風險）。我們選擇了一個假設之后（更直觀點說，我們得到了一個分類器以后），真實誤差無從得知，但我們可以用某些可以掌握的量來逼近它。最直觀的想法就是使用分類器在樣本數據上的分類的結果與真實結果（因為樣本是已經標注過的數據，是準確的數據）之間的差值來表示。這個差值叫做經驗風險R_emp(w)。以前的機器學習方法都把經驗風險最小化作為努力的目標，但后來發現很多分類函數能夠在樣本集上輕易達到100%的正確率，在真實分類時卻一塌糊涂（即所謂的推廣能力差，或泛化能力差）。此時的情況便是選擇了一個足夠復雜的分類函數（它的VC維很高），能夠精確的記住每一個樣本，但對樣本之外的數據一律分類錯誤。回頭看看經驗風險最小化原則我們就會發現，此原則適用的大前提是經驗風險要確實能夠逼近真實風險才行（行話叫一致），但實際上能逼近么？答案是不能，因為樣本數相對于現實世界要分類的文本數來說簡直九牛一毛，經驗風險最小化原則只在這占很小比例的樣本上做到沒有誤差，當然不能保證在更大比例的真實文本上也沒有誤差。

統計學習因此而引入了泛化誤差界的概念，就是指真實風險應該由兩部分內容刻畫，一是經驗風險，代表了分類器在給定樣本上的誤差；二是置信風險，代表了我們在多大程度上可以信任分類器在未知文本上分類的結果。很顯然，第二部分是沒有辦法精確計算的，因此只能給出一個估計的區間，也使得整個誤差只能計算上界，而無法計算準確的值（所以叫做泛化誤差界，而不叫泛化誤差）。

置信風險與兩個量有關，一是樣本數量，顯然給定的樣本數量越大，我們的學習結果越有可能正確，此時置信風險越?。欢欠诸惡瘮档腣C維，顯然VC維越大，推廣能力越差，置信風險會變大。

泛化誤差界的公式為：

R(w)≤R_emp(w)+Ф(n/h)

公式中R(w)就是真實風險，R_emp(w)就是經驗風險，Ф(n/h)就是置信風險。統計學習的目標從經驗風險最小化變為了尋求經驗風險與置信風險的和最小，即結構風險最小。

SVM正是這樣一種努力最小化結構風險的算法。

SVM其他的特點就比較容易理解了。

小樣本，并不是說樣本的絕對數量少（實際上，對任何算法來說，更多的樣本幾乎總是能帶來更好的效果），而是說與問題的復雜度比起來，SVM算法要求的樣本數是相對比較少的。

非線性，是指SVM擅長應付樣本數據線性不可分的情況，主要通過松弛變量（也有人叫懲罰變量）和核函數技術來實現，這一部分是SVM的精髓，以后會詳細討論。多說一句，關于文本分類這個問題究竟是不是線性可分的，尚沒有定論，因此不能簡單的認為它是線性可分的而作簡化處理，在水落石出之前，只好先當它是線性不可分的（反正線性可分也不過是線性不可分的一種特例而已，我們向來不怕方法過于通用）。

高維模式識別是指樣本維數很高，例如文本的向量表示，如果沒有經過另一系列文章（《文本分類入門》）中提到過的降維處理，出現幾萬維的情況很正常，其他算法基本就沒有能力應付了，SVM卻可以，主要是因為SVM 產生的分類器很簡潔，用到的樣本信息很少（僅僅用到那些稱之為“支持向量”的樣本，此為后話），使得即使樣本維數很高，也不會給存儲和計算帶來大麻煩（相對照而言，kNN算法在分類時就要用到所有樣本，樣本數巨大，每個樣本維數再一高，這日子就沒法過了……）。

下一節開始正式討論SVM。別嫌我說得太詳細哦。

SVM入門（二）線性分類器Part 1

線性分類器(一定意義上,也可以叫做感知機) 是最簡單也很有效的分類器形式.在一個線性分類器中,可以看到SVM形成的思路,并接觸很多SVM的核心概念.

用一個二維空間里僅有兩類樣本的分類問題來舉個小例子。如圖所示

C₁和C₂是要區分的兩個類別，在二維平面中它們的樣本如上圖所示。中間的直線就是一個分類函數，它可以將兩類樣本完全分開。一般的，如果一個線性函數能夠將樣本完全正確的分開，就稱這些數據是線性可分的，否則稱為非線性可分的。

什么叫線性函數呢？在一維空間里就是一個點，在二維空間里就是一條直線，三維空間里就是一個平面，可以如此想象下去，如果不關注空間的維數，這種線性函數還有一個統一的名稱——超平面（Hyper Plane）！

實際上，一個線性函數是一個實值函數（即函數的值是連續的實數），而我們的分類問題（例如這里的二元分類問題——回答一個樣本屬于還是不屬于一個類別的問題）需要離散的輸出值，例如用1表示某個樣本屬于類別C₁，而用0表示不屬于（不屬于C₁也就意味著屬于C₂），這時候只需要簡單的在實值函數的基礎上附加一個閾值即可，通過分類函數執行時得到的值大于還是小于這個閾值來確定類別歸屬。例如我們有一個線性函數

g(x)=wx+b

我們可以取閾值為0，這樣當有一個樣本x_i需要判別的時候，我們就看g(x_i)的值。若g(x_i)>0，就判別為類別C₁，若g(x_i)<0，則判別為類別C₂（等于的時候我們就拒絕判斷，呵呵）。此時也等價于給函數g(x)附加一個符號函數sgn()，即f(x)=sgn [g(x)]是我們真正的判別函數。

關于g(x)=wx+b這個表達式要注意三點：一，式中的x不是二維坐標系中的橫軸，而是樣本的向量表示，例如一個樣本點的坐標是(3,8)，則x^T=(3,8) ，而不是x=3（一般說向量都是說列向量，因此以行向量形式來表示時，就加上轉置）。二，這個形式并不局限于二維的情況，在n維空間中仍然可以使用這個表達式，只是式中的w成為了n維向量（在二維的這個例子中，w是二維向量，為了表示起來方便簡潔，以下均不區別列向量和它的轉置，聰明的讀者一看便知）；三，g(x)不是中間那條直線的表達式，中間那條直線的表達式是g(x)=0，即wx+b=0，我們也把這個函數叫做分類面。

實際上很容易看出來，中間那條分界線并不是唯一的，我們把它稍微旋轉一下，只要不把兩類數據分錯，仍然可以達到上面說的效果，稍微平移一下，也可以。此時就牽涉到一個問題，對同一個問題存在多個分類函數的時候，哪一個函數更好呢？顯然必須要先找一個指標來量化“好”的程度，通常使用的都是叫做“分類間隔”的指標。下一節我們就仔細說說分類間隔，也補一補相關的數學知識。

SVM入門（三）線性分類器Part 2

上回說到對于文本分類這樣的不適定問題（有一個以上解的問題稱為不適定問題），需要有一個指標來衡量解決方案（即我們通過訓練建立的分類模型）的好壞，而分類間隔是一個比較好的指標。

在進行文本分類的時候，我們可以讓計算機這樣來看待我們提供給它的訓練樣本，每一個樣本由一個向量（就是那些文本特征所組成的向量）和一個標記（標示出這個樣本屬于哪個類別）組成。如下：

D_i=(x_i,y_i)

x_i就是文本向量（維數很高），y_i就是分類標記。

在二元的線性分類中，這個表示分類的標記只有兩個值，1和-1（用來表示屬于還是不屬于這個類）。有了這種表示法，我們就可以定義一個樣本點到某個超平面的間隔：

δ_i=y_i(wx_i+b)

這個公式乍一看沒什么神秘的，也說不出什么道理，只是個定義而已，但我們做做變換，就能看出一些有意思的東西。

首先注意到如果某個樣本屬于該類別的話，那么wx_i+b>0（記得么？這是因為我們所選的g(x)=wx+b就通過大于0還是小于0來判斷分類），而y_i也大于0；若不屬于該類別的話，那么wx_i+b<0，而y_i也小于0，這意味著y_i(wx_i+b)總是大于0的，而且它的值就等于|wx_i+b|！（也就是|g(x_i)|）

現在把w和b進行一下歸一化，即用w/||w||和b/||w||分別代替原來的w和b，那么間隔就可以寫成

這個公式是不是看上去有點眼熟？沒錯，這不就是解析幾何中點x_i到直線g(x)=0的距離公式嘛?。ㄍ茝V一下，是到超平面g(x)=0的距離， g(x)=0就是上節中提到的分類超平面）

小Tips：||w||是什么符號？||w||叫做向量w的范數，范數是對向量長度的一種度量。我們常說的向量長度其實指的是它的2-范數，范數最一般的表示形式為p-范數，可以寫成如下表達式

向量w=(w₁, w₂, w₃,…… w_n)

它的p-范數為

看看把p換成2的時候，不就是傳統的向量長度么？當我們不指明p的時候，就像||w||這樣使用時，就意味著我們不關心p的值，用幾范數都可以；或者上文已經提到了p的值，為了敘述方便不再重復指明。

當用歸一化的w和b代替原值之后的間隔有一個專門的名稱，叫做幾何間隔，幾何間隔所表示的正是點到超平面的歐氏距離，我們下面就簡稱幾何間隔為“距離”。以上是單個點到某個超平面的距離（就是間隔，后面不再區別這兩個詞）定義，同樣可以定義一個點的集合（就是一組樣本）到某個超平面的距離為此集合中離超平面最近的點的距離。下面這張圖更加直觀的展示出了幾何間隔的現實含義：

H是分類面，而H₁和H₂是平行于H，且過離H最近的兩類樣本的直線，H₁與H，H₂與H之間的距離就是幾何間隔。

之所以如此關心幾何間隔這個東西，是因為幾何間隔與樣本的誤分次數間存在關系：

其中的δ是樣本集合到分類面的間隔，R=max ||xi|| i=1,...,n，即R是所有樣本中（xi是以向量表示的第i個樣本）向量長度最長的值（也就是說代表樣本的分布有多么廣）。先不必追究誤分次數的具體定義和推導過程，只要記得這個誤分次數一定程度上代表分類器的誤差。而從上式可以看出，誤分次數的上界由幾何間隔決定?。ó斎唬菢颖疽阎臅r候）

至此我們就明白為何要選擇幾何間隔來作為評價一個解優劣的指標了，原來幾何間隔越大的解，它的誤差上界越小。因此最大化幾何間隔成了我們訓練階段的目標，而且，與二把刀作者所寫的不同，最大化分類間隔并不是SVM的專利，而是早在線性分類時期就已有的思想。

發表于 2009-02-13 11:04 Jasper 閱讀(152883) 評論(110) 編輯收藏所屬分類: 文本分類技術

評論

# re: SVM入門（一）至（三）Refresh

非常好，希望在文本挖掘方面有更多的類似的介紹，謝謝!

希望評論于 2009-05-30 13:23 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

寫的真好。。。。作者是真懂了。

lg 評論于 2009-06-13 08:01 回復更多評論

# re: SVM入門（一）至（三）Refresh

發表真誠學習見解受到大家尊重，支持你

旭熙評論于 2009-06-21 22:53 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

關于VC維的解釋有點模糊，不太懂哎，VC維具體是什么概念？還有VC維高了到底是好事還是壞事？大蝦幫忙解釋下行嗎？

lk 評論于 2009-08-13 16:28 回復更多評論

# re: SVM入門（一）至（三）Refresh

真的是高手，懂得svm不難，難的是說的如此易懂，謝謝了，忍不住留言~

Mg 評論于 2009-08-18 19:45 回復更多評論

# re: SVM入門（一）至（三）Refresh

果然厲害！拜讀！

不知道評論于 2009-08-27 16:06 回復更多評論

# re: SVM入門（一）至（三）Refresh

很強大，很明白，不是專家寫不出這么明白的文章。

www 評論于 2009-09-22 20:45 回復更多評論

# re: SVM入門（一）至（三）Refresh

請教一下margin = 2/||w||是怎么得到的嗎？如果按照兩條平行線間的距離應該是2/sqrt（||w||^2 + 1)啊。

surfnow 評論于 2009-09-25 10:12 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

大牛啊,樓主..不得不贊一下....能把SVM說的這樣簡單,佩服,佩服...

小宇評論于 2009-12-10 21:49 回復更多評論

# re: SVM入門（一）至（三）Refresh

忍不住頂一個

湯軍評論于 2009-12-21 18:13 回復更多評論

# re: SVM入門（一）至（三）Refresh

y=wx+b 既然是直線 w 為什么是向量

地方評論于 2010-03-22 15:34 回復更多評論

# re: SVM入門（一）至（三）Refresh

學堂諸師若如博主，國之明天可期也。

東方亮評論于 2010-03-22 23:21 回復更多評論

# re: SVM入門（一）至（三）Refresh

此x非彼x。可以理解為wx+b 是 x的線性變換。
而（w1，w2）*（x，y）+b = 0 才是直線方程吧。
@地方

東方亮評論于 2010-03-22 23:27 回復更多評論

# re: SVM入門（一）至（三）Refresh

頂，太牛了，挺有啟發。學習當中

lsm 評論于 2010-04-29 23:33 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的非常好，很清楚，學習了

jingwei 評論于 2010-05-26 15:20 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

"關于g(x)=wx+b這個表達式要注意三點："這一部分，一會兒說x是向量，一會兒說w是向量，不太明白。

test 評論于 2010-06-13 10:52 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

“關于g(x)=wx+b這個表達式要注意三點：”這一部分中，w和x到底哪個是向量？

test 評論于 2010-06-13 10:52 回復更多評論

# re: SVM入門（一）至（三）Refresh

SVM的八股簡介

淘寶網評論于 2010-07-07 16:37 回復更多評論

# re: SVM入門（一）至（三）Refresh

太牛了！能把SVM講的這么通俗易懂！你是大牛！你是普及高深科學知識的大牛呀！哈哈……
希望你以后能發更多的文章?。?！

tq 評論于 2010-08-15 19:08 回復更多評論

# re: SVM入門（一）至（三）Refresh

點到直線的距離，做解析幾何中為：

D = (Ax + By + c) /sqrt(A^2+B^2)
sqrt(A^2+B^2)就相當于||W||, 其中向量W=[A, B];
(Ax + By + c)就相當于g(X), 其中向量X=[x,y]。

東西合璧評論于 2010-08-29 09:13 回復更多評論

# re: SVM入門（一）至（三）Refresh

膜拜樓主

莫言評論于 2010-09-09 00:26 回復更多評論

# re: SVM入門（一）至（三）Refresh

佩服佩服??！鄙人受益匪淺！

learner 評論于 2010-10-18 12:54 回復更多評論

# re: SVM入門（一）至（三）Refresh

從別人轉載的地方找到了這篇文章，感覺太精彩了，我在很多地方（包括教科書）都找過svm的介紹，但作為一名數學知識有限的本科學生，讀課本十分吃力，10句話8句不知所云?？吹搅四氵@篇文章感到眼前一亮，這么深入淺出的文章確實不常見。特地找到了原出處感謝一下~

jokoken 評論于 2010-11-06 16:31 回復更多評論

# re: SVM入門（一）至（三）Refresh

非常感謝作者，寫的很好，文筆幽默，講解透徹

金陵笑笑生評論于 2010-11-08 22:04 回復更多評論

# re: SVM入門（一）至（三）Refresh

..........高維模式識別是指樣本維數很高，例如文本的向量表示，如果沒有經過另一系列文章（《文本分類入門》）中提到過的降維處理，出現幾萬維的情況很正常，其他算法基本就沒有能力應付了，SVM卻可以，主要是因為SVM 產生的分類器很簡潔，用到的樣本信息很少（僅僅用到那些稱之為“支持向量”的樣本，此為后話），使得即使樣本維數很高，也不會給存儲和計算帶來大麻煩（相對照而言，kNN算法在分類時就要用到所有樣本，樣本數巨大，每個樣本維數再一高，這日子就沒法過了……）。 ..........

這個說法好像不是很準確. 用線性分類器的話，有很多分類器可以處理高維數據，非線性分類的話，SVM也不能處理幾萬維的數據。

chen_1 評論于 2010-11-17 17:59 回復更多評論

# re: SVM入門（一）至（三）Refresh

@志大才疏
首先感謝樓主的好文，能把SVM說的通俗易懂真是佩服！比起樓主寫的，我看好多老師都可以下崗回家了，有些書、paper啊實在是不敢恭維。

看到好多人都在問g(x)=0 和 g(x)的問題，我在這里幫樓主補充一下：g(x)實際是以w為法向量的一簇超平面，在二維空間表示為一簇直線（就是一簇平行線，他們的法向量都是w），而g(x)=0只是這么多平行線中的一條。

物理意義搞清楚了，大家可以接著往后看了。我也繼續向樓主學習了。希望樓主都多多分享自己的理解，期待樓主后續好作品。

Andyseren 評論于 2010-12-24 00:02 回復更多評論

# re: SVM入門（一）至（三）Refresh

敢問這位那個2/||w||是怎么得來的嗎？@Andyseren

lingzhuxi 評論于 2011-04-11 10:34 回復更多評論

# re: SVM入門（一）至（三）Refresh

請問下面這個是怎么得來的嗎？距離是：向兩邊平移H線直到接觸到兩邊樣本的第一個為止，即H1和H2，然后中間的距離怎么是2/||w||？

lingzhuxi 評論于 2011-04-11 10:46 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫得真好，多謝博主！

yaya 評論于 2011-05-04 08:52 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

拜讀文章，比看書頂用多了！受益匪淺！

王睿評論于 2011-05-15 21:08 回復更多評論

# re: SVM入門（一）至（三）Refresh

非常好,太好了!!

dyn 評論于 2011-05-31 21:46 回復更多評論

# re: SVM入門（一）至（三）Refresh

十分感謝大神

frozenxia 評論于 2011-07-13 14:38 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的真好，關于svm還有什么相關的書嗎？推薦一下，謝謝

66666 評論于 2011-08-05 12:29 回復更多評論

# re: SVM入門（一）至（三）Refresh

高人

xm 評論于 2011-08-23 21:18 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

我是做圖像的，謝謝你的文章！

xw 評論于 2011-11-18 18:14 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

很好！！??！

cj 評論于 2011-11-26 23:23 回復更多評論

# re: SVM入門（一）至（三）Refresh

Q：以上δi不是求一個樣本點到分類面的間隔，那怎么求樣本幾何到分類面的間隔δ？？？

Lo 評論于 2011-12-08 17:55 回復更多評論

# re: SVM入門（一）至（三）Refresh

很喜歡機器學習，但不知道從什么地方入手，學習充滿困境與向往，看了你的文章獲益匪淺，是啊，愛上它，就要從思維開始，它不是課本，是一位久違的老友，是一位剛牽手的女友。同志，多謝了。感謝！?。?！

SVMer 評論于 2012-03-20 21:29 回復更多評論

# re: SVM入門（一）至（三）Refresh

開始學習下

tanglei 評論于 2012-03-23 10:36 回復更多評論

# re: SVM入門（一）至（三）Refresh

@Andyseren
paper的目的是把1+1=2簡單的問題說成讓很多人看不懂。這就是paper。o(∩_∩)o 哈哈

tanglei 評論于 2012-03-23 10:59 回復更多評論

# re: SVM入門（一）至（三）Refresh

好

lsysbl 評論于 2012-03-25 16:32 回復更多評論

# re: SVM入門（一）至（三）Refresh

確實說的很好，解釋的非常清楚，看的出樓主的數學功底很強。真誠感謝樓主的說明。

adong 評論于 2012-07-13 16:02 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

感謝樓主，的確把svm這么難懂的理論，說的很清楚，深入淺出，大師所為啊，佩服。希望繼續出類似高質量的文章。
如果有可能的話，能否做一些關于CRD(conditional random field)的介紹呢？看論文一點都沒懂。

vincent 評論于 2012-09-27 17:12 回復更多評論

# re: SVM入門（一）至（三）Refresh

好理解好理解，不像一些人疙疙瘩瘩疙疙瘩瘩半天都張著嘴巴說不出來。。謝謝樓主，希望看到更多的樓主關于機器學習的寫作。
不知道有沒有像樓主說的這樣子的書籍，？？
現在的大牛書，就是故意弄得很難，故意讓你看不懂!

592800277 評論于 2012-11-01 11:09 回復更多評論

# re: SVM入門（一）至（三）Refresh

請問那個2/||w||是怎么得來的？

3 評論于 2012-11-12 17:40 回復更多評論

# re: SVM入門（一）至（三）Refresh

看了一遍，感覺很經典，準備看第二遍的。。。

孫大申評論于 2012-12-04 21:03 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

受益匪淺啊

key 評論于 2012-12-09 16:42 回復更多評論

# re: SVM入門（一）至（三）Refresh

@志大才疏
沒錯的。w是我們所用坐標系下x和y的系數組成的行向量，你再想下。

丁晟評論于 2013-01-08 10:53 回復更多評論

# re: SVM入門（一）至（三）Refresh

受教了，寫的好！

melisa 評論于 2013-01-17 16:59 回復更多評論

# re: SVM入門（一）至（三）Refresh

請教："即R是所有樣本中（xi是以向量表示的第i個樣本）向量長度最長的值（也就是說代表樣本的分布有多么廣）"，在訓練時，應該有辦法減小R這個這值吧

IDLE 評論于 2013-01-25 16:55 回復更多評論

# re: SVM入門（一）至（三）Refresh

謝謝作者，支持博主

suhan 評論于 2013-03-03 16:45 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的清晰明了。不過在計算間隔那一步實際目的就是計算距離而不是參數歸一化吧。

JPL 評論于 2013-04-04 14:27 回復更多評論

# re: SVM入門（一）至（三）Refresh

同解@JPL

fsdf 評論于 2013-05-05 21:46 回復更多評論

# re: SVM入門（一）至（三）Refresh

2/||W||可能是這么來的,正例有g(x) >=1, 所以正例里的點到g(w)=0的最小距離為1/||w||,反例亦然,故兩個margin之間的距離為2/||w||

QAMichaelPeng 評論于 2013-06-09 12:29 回復更多評論

# re: SVM入門（一）至（三）Refresh

不錯不錯~ 說的好直白~ 多謝樓主分享啊

Eden 評論于 2013-06-27 21:09 回復更多評論

# re: SVM入門（一）至（三）Refresh

@地方
我也不太懂這個w在wx+b的含義

yibaoemily 評論于 2013-07-15 14:21 回復更多評論

# re: SVM入門（一）至（三）Refresh

@Andyseren
哇，這么說就清楚多了！感謝！

yibaoemily 評論于 2013-07-15 14:36 回復更多評論

# re: SVM入門（一）至（三）Refresh

@丁晟
如果w是行向量，x是列向量，那wx就是一個數字了，那么b呢？b也應該是一個數字，我一直都把b理解成一個列向量了。

yibaoemily 評論于 2013-07-15 14:38 回復更多評論

# re: SVM入門（一）至（三）Refresh

@lingzhuxi
剛看到這里的時候我也不太了解，但看了下一篇SVM潤（四）就懂了。SVM的目標是最大化幾何間隔，而間隔一般是固定的，例如1。所以最大化幾何間隔就轉化成了最小化||w||。H到H1的幾何間隔是1/||w||，所以H1到H2的幾何間隔就是2/||w||了。

yibaoemily 評論于 2013-07-15 14:53 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的真好，贊一個。

黃貓貓評論于 2013-07-16 22:46 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

'為SVM關注的是VC維，后面我們可以看到，SVM解決問題的時候，和樣本的維數是無關的'

不是很理解VC維和這句話，我的理解是VC維和樣本維度是相關的，比如樣本維度是2，最多就有2^2個樣本，如果是二分類問題，’最大的VC維‘就是2^(2^2)
如果相關的話，上面的話不是矛盾么？

wfw 評論于 2013-07-28 16:10 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

'高維模式識別是指樣本維數很高，例如文本的向量表示，如果沒有經過另一系列文章（《文本分類入門》）中提到過的降維處理，出現幾萬維的情況很正常，其他算法基本就沒有能力應付了，SVM卻可以，主要是因為SVM 產生的分類器很簡潔，用到的樣本信息很少（僅僅用到那些稱之為“支持向量”的樣本，此為后話），使得即使樣本維數很高，也不會給存儲和計算帶來大麻煩（相對照而言，kNN算法在分類時就要用到所有樣本，樣本數巨大，每個樣本維數再一高，這日子就沒法過了……）。'

其心有兩個地方不理解：

1. ‘其他算法基本就沒能力應付了’中其他算法出了后面提到的knn還有誰？粗略想了一下常見的分類算法，貝葉斯，決策樹，線性回歸，邏輯回歸這些都OK吧？
2. ‘用到的樣本信息很少’大概明白LZ的意思，但還是感覺有點。。。

wfw 評論于 2013-07-28 16:27 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的很好，很有收獲

ml 評論于 2013-09-15 20:40 回復更多評論

# re: SVM入門（一）至（三）Refresh

二維平面上x是二維向量，所以wx+b=0是條直線@志大才疏

lscience 評論于 2013-09-17 14:59 回復更多評論

# re: SVM入門（一）至（三）Refresh

連我這個外專業的，連高中數學都忘記了的人兒都基本看明白了。好！繼續拜讀

飯鳥評論于 2013-09-19 00:50 回復更多評論

# re: SVM入門（一）至（三）Refresh

@yibaoemily

在二維里面，也就是這篇文章里的例子中。b就是一個數，而wx是兩個向量的內積。別被x的表面所迷惑，你把x換成別的字母會更好理解一些。要是把x換成s，就變成ws+b。w=(A,B);s=(x,y)^T,這里面的x，y你都可以理解為x軸的坐標和y軸的坐標。所以，ws+b的展開形式就是Ax+By+b=0，這剛好在二維平面里就是直線的定義。

冷月無痕評論于 2013-09-26 14:26 回復更多評論

# re: SVM入門（一）至（三）Refresh

必須頂一個?。。?！

von 評論于 2013-10-29 15:35 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的真好！

實習醫生楊評論于 2013-11-13 21:48 回復更多評論

# re: SVM入門（一）至（三）Refresh

樓主寫的真是太好了，大贊

mayday 評論于 2013-12-02 17:54 回復更多評論

# re: SVM入門（一）至（三）Refresh

1024

王分評論于 2013-12-05 17:17 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

同意博主的觀點。特征的選取應該是看對什么樣的文檔進行分類了。我現在是在做人名消歧，但是特征項選定以后，我不知道用什么方法去進行權重表示。。?？刹豢梢栽谶@方面給點意見呢？謝謝

木木評論于 2013-12-05 17:19 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

不好意思，上面的評論發錯地方了。應該是針對博主《文本分類入門（番外篇）特征選擇與特征權重計算的區別》表示是一點看法。

木木評論于 2013-12-05 17:21 回復更多評論

# re: SVM入門（一）至（三）Refresh

真不知道該怎么感謝樓主，寫得太好了，非常感謝，送人玫瑰，手留余香。

xr1064 評論于 2013-12-20 23:44 回復更多評論

# re: SVM入門（一）至（三）Refresh

@志大才疏
個人理解，w,b都是未知的，怎么是一個點呢？X是已知量...

Ferret 評論于 2013-12-29 11:39 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

但是這樣的話，斜率只能是1了，斜線的斜度是定了的@Jasper

future 評論于 2013-12-30 19:58 回復更多評論

# re: SVM入門（一）至（三）Refresh

博主發的文章真好，我要好好看，太感謝了！?。。?/div>

胡喬楠評論于 2014-01-13 11:13 回復更多評論

# re: SVM入門（一）至（三）Refresh

nice 樓豬不錯

kong 評論于 2014-02-08 14:23 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

博主厲害，我這是看第二次了。

adam 評論于 2014-02-24 17:05 回復更多評論

# re: SVM入門（一）至（三）Refresh

謝謝呀，深入淺出。很好的博文

shc 評論于 2014-04-09 09:59 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

學堂諸師若如博主，國之明天可期也。

jack 評論于 2014-05-12 20:18 回復更多評論

# re: SVM入門（一）至（三）Refresh

感謝博主的分享真心感謝

LHYL 評論于 2014-06-17 20:37 回復更多評論

# re: SVM入門（一）至（三）Refresh

太好了，博主太牛了，膜拜！

DT 評論于 2014-07-02 20:23 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的很好！

snyi 評論于 2014-08-16 11:50 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫得太好了，通俗易懂，每次有看到不懂的概念，你都在一旁標注補充了，省了我自己去查百科的時間，太感謝了！

兮嘉評論于 2014-08-20 00:09 回復更多評論

# re: SVM入門（一）至（三）Refresh

您好！文中提到把w和b歸一化，為什么會是b/|w|,而不是b/|b|呢？

毛毛Kitty 評論于 2014-10-07 17:42 回復更多評論

# re: SVM入門（一）至（三）Refresh

謝謝，看了有收獲

風之泥古評論于 2014-10-10 16:03 回復更多評論

# re: SVM入門（一）至（三）Refresh

@毛毛Kitty
歸一化應該是讓X的系數為1，所以是提出一個w,wx+b=w(x+b/w)

在凌晨醒來評論于 2014-12-12 21:08 回復更多評論

# re: SVM入門（一）至（三）Refresh

真的是深入淺出，所有用到的額外重點知識都有專門的小貼士作為專門說明和解釋，整篇教程讀起來沒有滯澀之處。完全可以作為入門教材。感謝博主

doze_worm 評論于 2014-12-18 10:28 回復更多評論

# re: SVM入門（一）至（三）Refresh

兩年前本科論文用到SVM，看了博主的大作，今日研究生又用到SVM，再來回味。

Shepherd 評論于 2015-01-04 19:53 回復更多評論

# re: SVM入門（一）至（三）Refresh

寫的很好，學習了，多謝博主！

liucaihong 評論于 2015-03-14 14:42 回復更多評論

# re: SVM入門（一）至（三）Refresh

一直喜歡機器學習算法，在其他地方看了不少，都看的不是很懂！這次看了一遍明其他不明白的地方懂了很多。非常感謝博主了！

gzw 評論于 2015-03-19 16:53 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

贊，太厲害太偉大

Harry 評論于 2015-04-24 09:19 回復更多評論

# re: SVM入門（一）至（三）Refresh

流著淚點個贊T T

尼采的內臟評論于 2015-04-28 16:04 回復更多評論

# re: SVM入門（一）至（三）Refresh[未登錄]

真的感覺樓主是學透了

Michael 評論于 2015-06-17 16:48 回復更多評論

# re: SVM入門（一）至（三）Refresh

看了之后，我知道了什么是分類面，什么是范數，什么是置信風險、經驗風險，對VC維和結構風險也有了直觀的理解。其它的還需要細細品味...

劉書龍評論于 2015-07-20 19:52 回復更多評論

# re: SVM入門（一）至（三）Refresh

贊贊

夜月序曲評論于 2015-10-20 14:20 回復更多評論

# re: SVM入門（一）至（三）Refresh

作者的講解很透徹，很贊

zlg 評論于 2015-12-27 19:41 回復更多評論

# re: SVM入門（一）至（三）Refresh

不能更贊，寫的非常好

深海刀魚評論于 2016-02-22 08:31 回復更多評論

# re: SVM入門（一）至（三）Refresh

@志大才疏
簡單來說，二維坐標系的橫軸是x1，縱軸是x2

hgl 評論于 2016-02-29 10:45 回復更多評論

# re: SVM入門（一）至（三）Refresh

老師您講的很清楚，我還想問一個問題就是在用libsvm的時候交叉驗證精度和model實際預測精度有什么關系么？交叉驗證精度是在訓練集上的平均精度，用來尋找最優參數的，所以應該跟驗證機預測精度沒什么關系吧？交叉訓練精度很高預測精度也有可能很低對吧？

幸福三葉草評論于 2016-03-17 10:42 回復更多評論

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 文本分類入門（番外篇）特征選擇與特征權重計算的區別 SVM入門（十）將SVM用于多類分類文本分類入門（十一）特征選擇方法之信息增益 SVM入門（九）松弛變量（續） SVM入門（八）松弛變量 SVM入門（七）為何需要核函數 SVM入門（六）線性分類器的求解——問題的轉化，直觀角度 SVM入門（五）線性分類器的求解——問題的描述Part2 SVM入門（四）線性分類器的求解——問題的描述Part1 SVM入門（一）至（三）Refresh

SVM入門（一）至（三）Refresh

按:之前的文章重新匯編一下,修改了一些錯誤和不當的說法，一起復習,然后繼續SVM之旅.

（一）SVM的八股簡介

SVM入門（二）線性分類器Part 1

SVM入門（三）線性分類器Part 2

公告

常用鏈接

留言簿(64)

隨筆分類

隨筆檔案

文章分類

搜索

最新評論

閱讀排行榜

評論排行榜

Jasper's Java Jacal 嘉士伯的Java小屋
BlogJava \| 首頁 \| 發新隨筆 \| 發新文章 \| 聯系 \| 聚合 \| 管理	隨筆：51 文章：2 評論：717 引用：0