10.23 MATLAB中SVM的用法技术頭條網

10.23 MATLAB中SVM的用法

LIBSVM是臺灣大學林智仁(Lin Chih-Jen)教授等開發設計的一個簡單、易於使用和快速有效的SVM模式識別與迴歸的軟件包，他不但提供了編譯好的可在Windows系列系統的執行文件，還提供了源代碼，方便改進、修改以及在其它操作系統上應用；該軟件對SVM所涉及的參數調節相對比較少，提供了很多的默認參數，利用這些默認參數可以解決很多問題；並提供了交互檢驗(Cross Validation)的功能。該軟件可以解決C-SVM、ν-SVM、ε-SVR和ν-SVR等問題，包括基於一對一算法的多類模式識別問題。注意不是matlab自帶的svm實現函數。

model = libsvmtrain(training_label_vector, training_instance_matrix [, ‘libsvm_options’]);

這個函數有三個參數，其中

-training_label_vector:訓練樣本的類標，如果有m個樣本，就是m x 1的矩陣（類型必須為double）。這裡可以是二分類和多分類，類標是（-1,1）、（1,2,3）或者其他任意用來表示不同的類別的數字，要轉成double類型。

-training_instance_matrix:訓練樣本的特徵，如果有m個樣本，每個樣本特徵是n維，則為m x n的矩陣（類型必須為double）。

-libsvm_options:訓練的參數，在第3點詳細介紹。

libsvmtrain函數返回訓練好的SVM分類器模型model是一個結構體，包含以下成員：

-Parameters: 一個5 x 1的矩陣，從上到下依次表示：

-s SVM類型（默認0）；

-t 核函數類型（默認2）

-d 核函數中的degree設置(針對多項式核函數)(默認3)；

-g 核函數中的r(gamma）函數設置(針對多項式/rbf/sigmoid核函數) (默認類別數目的倒數)；

-r 核函數中的coef0設置(針對多項式/sigmoid核函數)((默認0)

-nr_class: 表示數據集中有多少類別，比如二分類時這個值即為2。

-totalSV: 表示支持向量的總數。

-rho: 決策函數wx+b中的常數項的相反數（-b）。

-Label: 表示數據集中類別的標籤，比如二分類常見的1和-1。

-ProbA: 使用-b參數時用於概率估計的數值，否則為空。

-ProbB: 使用-b參數時用於概率估計的數值，否則為空。

-nSV: 表示每類樣本的支持向量的數目，和Label的類別標籤對應。如Label=[1; -1],nSV=[63; 67]，則標籤為1的樣本有63個支持向量，標籤為-1的有67個。

-sv_coef: 表示每個支持向量在決策函數中的係數。

-SVs: 表示所有的支持向量，如果特徵是n維的，支持向量一共有m個，則為m x n的稀疏矩陣。

另外，如果在訓練中使用了-v參數進行交叉驗證時，返回的不是一個模型，而是交叉驗證的分類的正確率或者回歸的均方根誤差。

當構建完成model後，還要為上述參數選擇合適的值，方法主要有Gridsearch,其他的感覺不常用，Gridsearch說白了就是窮舉。

網格參數尋優函數(分類問題):SVMcgForClass

[bestCVaccuracy,bestc,bestg]=SVMcgForClass(train_label,train,cmin,cmax,gmin,gmax,v,cstep,gstep,accstep)

輸入：

train_label:訓練集的標籤，格式要求與svmtrain相同。

train:訓練集，格式要求與svmtrain相同。

cmin,cmax:懲罰參數c的變化範圍，即在[2^cmin,2^cmax]範圍內尋找最佳的參數c，默認值為cmin=-8，cmax=8，即默認懲罰參數c的範圍是[2^(-8),2^8]。

gmin,gmax:RBF核參數g的變化範圍，即在[2^gmin,2^gmax]範圍內尋找最佳的RBF核參數g，默認值為gmin=-8，gmax=8，即默認RBF核參數g的範圍是[2^(-8),2^8]。

v:進行Cross Validation過程中的參數，即對訓練集進行v-fold Cross Validation，默認為3，即默認進行3折CV過程。

cstep,gstep:進行參數尋優是c和g的步進大小，即c的取值為2^cmin,2^(cmin+cstep),…,2^cmax,，g的取值為2^gmin,2^(gmin+gstep),…,2^gmax，默認取值為cstep=1,gstep=1。

accstep:最後參數選擇結果圖中準確率離散化顯示的步進間隔大小（[0,100]之間的一個數），默認為4.5。

輸出：

bestCVaccuracy:最終CV意義下的最佳分類準確率。

bestc:最佳的參數c。

bestg:最佳的參數g。

網格參數尋優函數(迴歸問題):SVMcgForRegress

[bestCVmse,bestc,bestg]=SVMcgForRegress(train_label,train,cmin,cmax,gmin,gmax,v,cstep,gstep,msestep)

其輸入輸出與SVMcgForClass類似，這裡不再贅述。

SVM 怎樣能得到好的結果：

對數據做歸一化（simple scaling）
應用 RBF kernel
用cross-validation和grid-search 得到最優的c和g
用得到的最優c和g訓練訓練數據
測試

libsvm使用誤區：

(1) 直接將訓練集合和測試集合簡單歸一化到[0,1]區間，可能導致實驗結果很差。

(2) 如果樣本的特徵數非常多，那麼就不必使用RBF核將樣本映射到高維空間。

a) 在特徵數非常多的情況下，使用線性核，結果已經非常好，並且只需要選擇參數C即可。

b) 雖然說RBF核的結果至少比線性核好，前提下搜索整個的空間。

(3) 樣本數<

(4) 樣本數和特徵數都非常多：推薦使用liblinear，更少的時間和內存，可比的準確率。

(5) 樣本數>>特徵數：如果想使用線性模型，可以使用liblinear，並且使用-s 2參數

分享到:

閱讀更多 靈思致遠IT學苑 的文章

關鍵字: 軟件福特C-MAX 林智仁

10.23 MATLAB中SVM的用法

相關文章:

10 種最具影響力的編程語言

Windows 10 新版將支持系統資源管理器查看 Linux 子系統文件目錄

Windows 10 Build 19603發佈：WSL中支持文件管理器

Windows 10 2004將迎來新版Linux子系統

10 本最適合初學者和高級程序員的Python書籍

微軟緊急修復 Windows 10 重大漏洞，解決 SMBv3 協議相關問題

Windows 10 並不是最脆弱的操作系統——實際上 Linux 可能才是

10、上下文管理協議

AnyTXT Searcher：Windows 10 下的全文搜索工具

03.02 AnyTXT Searcher：Windows 10 下的全文搜索工具

WinPE 10-8 謝爾蓋·斯特雷萊克 （X86/X64）

01.19 WinPE 10-8 謝爾蓋·斯特雷萊克 （X86/X64）

01.15 Windows 7正式停用，Windows 10 UWP v19.2控件工具更值得擁有

Windows 10 開啟 WSL 擁抱Linux系統

01.09 Windows 10 Build 19541更新：改善Cortana和任務管理器體驗

開發 Windows 10 用了哪種編程語言？

Windows 10 將支持 DNS over HTTPS（DoH）

VBA編程中常用過程代碼6-10

如何擁有一個 Windows 10 和 Debian 10 的雙系統

微軟發佈Windows 10 1903的05累積更新補丁KB4505057解決之前錯誤

Windows 10 1903的05累積更新KB4497936錯誤手動解決方法

JavaScript 10

02.13 Windows 10 激活之KMS激活篇

Python開源項目最新月榜TOP 10

10.IO流（代碼解析）

10.IO流（Java）

學界｜CIFAR-10+ImageNet=？CINIC-10！

10 張令人噴飯的程序員漫畫

Windows 10 配置Java 環境變量

Windows 10 讓人不爽的騷操作之二！

微軟將加強改進 Windows 10 Linux 子系統的 I

微軟洩漏了Win 10 InPrivate Desktop功能

10 個常用的軟體架構模式

10：SpringBoot項目中一步到位使用攔截器

Windows 10 SDK Build 17709發布

06.06 Windows 10 SDK預覽版17682發佈：支持MSIX

Windows 10 SDK預覽版17682發布：支持MSIX

Windows 10 4月更新全面推送！

05.01 Windows 10 April 2018 Update 更新方法彙總

可以運行在 Windows 10 中的最實用的 Linux 命令

微軟推送Windows 10 IoT快速預覽版17083更新

RouterOS配置DMZ（端口映射）

python筆記day-10

10.19 10 款神器下載工具，樣樣都能替代迅雷

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

WinPE 10-8 謝爾蓋·斯特雷萊克（X86/X64）

01.19 WinPE 10-8 謝爾蓋·斯特雷萊克（X86/X64）

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？