支持向量機(jī)在數(shù)據(jù)挖掘中的應(yīng)用研究論文

時間：2023-05-03 18:22:40 論文范文我要投稿

相關(guān)推薦

　　摘要：支持向量機(jī)(Support Vector Machine, SVM)是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中的一個很有效的工具。結(jié)合支持向量機(jī)在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中的應(yīng)用, 介紹了支持向量機(jī)的基本原理, 發(fā)展方向及其研究熱點(diǎn)。

支持向量機(jī)在數(shù)據(jù)挖掘中的應(yīng)用研究論文

　　關(guān)鍵詞：支持向量機(jī); 數(shù)據(jù)挖掘; 機(jī)器學(xué)習(xí)オ

　　1 SVM的提出和基本思想

　　支持向量機(jī)是Vapnik等人提出的，在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢,已應(yīng)用于手寫體識別、三維目標(biāo)識別、人臉識別、文本圖像分類等實(shí)際問題中，性能優(yōu)于已有的學(xué)習(xí)方法，表現(xiàn)出良好的學(xué)習(xí)能力。它是從線性可分情況下的線性分類面發(fā)展而來的，接著利用核函數(shù)很好的解決了非線性可分情況。

　　2 支持向量機(jī)的幾個發(fā)展

　�。�1）模糊支持向量機(jī)，引入樣本對類別的隸屬度函數(shù)，這樣每個樣本對于類別的影響是不同的，這種理論的應(yīng)用提高了SVM的抗噪聲的能力，尤其適合在未能完全揭示輸入樣本特性的情況下。

　�。�2）最小二乘支持向量機(jī)。這種方法是在1999年提出，經(jīng)過這幾年的發(fā)展，已經(jīng)應(yīng)用要很多相關(guān)的領(lǐng)域。研究的問題已經(jīng)推廣到：對于大規(guī)模數(shù)據(jù)集的處理；處理數(shù)據(jù)的魯棒性；參數(shù)調(diào)節(jié)和選擇問題；訓(xùn)練和仿真。

　�。�3）加權(quán)支持向量機(jī)（有偏樣本的加權(quán)，有偏風(fēng)險加權(quán)）。

　�。�4）主動學(xué)習(xí)的支持向量機(jī)。主動學(xué)習(xí)在學(xué)習(xí)過程中可以根據(jù)學(xué)習(xí)進(jìn)程，選擇最有利于分類器性能的樣本來進(jìn)一步訓(xùn)練分類器，特能有效地減少評價樣本的數(shù)量。

　�。�5）粗糙集與支持向量機(jī)的結(jié)合。首先利用粗糙集理論對數(shù)據(jù)的屬性進(jìn)行約簡，能在某種程度上減少支持向量機(jī)求解計(jì)算量。

　　（6）基于決策樹的支持向量機(jī)。對于多類問題，采用二岔樹將藥分類的樣本集構(gòu)造出一系列的兩類問題，每個兩類構(gòu)造一個SVM。

　�。�7）分級聚類的支持向量機(jī)�；诜旨壘垲惡蜎Q策樹思想構(gòu)建多類svm，使用分級聚類的方法，可以先把n-1個距離較近的類別結(jié)合起來，暫時看作一類，把剩下的一類作為單獨(dú)的一類，用svm分類，分類后的下一步不再考慮這單獨(dú)的一類，而只研究所合并的n-1類，再依次下去。

　�。�8）算法上的提高。Vapnik在1995年提出了一種稱為“chunking”的塊算法，即如果刪除矩陣中對應(yīng)Lagrange乘數(shù)為0的行和列，將不會影響最終結(jié)果。Osuna提出了一種分解算法，應(yīng)用于人臉識別領(lǐng)域。Joachims在1998年將Osuna提出的分解策略推廣到解決大型SVM學(xué)習(xí)的算法。Platt于1998年提出了序貫最小優(yōu)化每次的工作集中只有2個樣本。

　�。�9）核函數(shù)的構(gòu)造和參數(shù)的選擇理論研究。基于各個不同的應(yīng)用領(lǐng)域，可以構(gòu)造不同的核函數(shù)，能夠或多或少的引入領(lǐng)域知識�，F(xiàn)在核函數(shù)廣泛應(yīng)用的類型有：多項(xiàng)式逼近、貝葉斯分類器、徑向機(jī)函數(shù)、多層感知器。參數(shù)的選擇現(xiàn)在利用交叉驗(yàn)證的方法來確認(rèn)。

　�。�10）支持向量機(jī)從兩類問題向多類問題的推廣。Weston在1998年提出的多類算法為代表。在經(jīng)典svm理論的基礎(chǔ)上，直接在目標(biāo)函數(shù)上進(jìn)行改進(jìn)，重新構(gòu)造多值分類模型，建立k分類支持向量機(jī)。通過sv方法對新模型的目標(biāo)函數(shù)進(jìn)行優(yōu)化，實(shí)現(xiàn)多值分類。

　　一對多（one-against-rest）——Vapnik提出的,k類——k個分類器，第m個分類器將第m類與其余的類分開，也就是說將第m類重新標(biāo)號為1，其他類標(biāo)號為-1。完成這個過程需要計(jì)算k個二次規(guī)劃，根據(jù)標(biāo)號將每個樣本分開，最后輸出的是兩類分類器輸出為最大的那一類。不足：容易產(chǎn)生屬于多類別的點(diǎn)（多個1）和沒有被分類的點(diǎn)（標(biāo)號均為-1）——不對，訓(xùn)練樣本數(shù)據(jù)大，訓(xùn)練困難，推廣誤差無界。

　　層（數(shù)分類方法），是對一對一方法的改進(jìn)，將k個分類合并為兩個大類，每個大類里面再分成兩個子類，如此下去，直到最基本的k個分類，這樣形成不同的層次，每個層次都用svm來進(jìn)行分類——1對r-1法，構(gòu)建k-1個分類器，不存在拒絕分類區(qū)。

　　3 主要研究熱點(diǎn)

　　從上面的發(fā)展中，我們可以總結(jié)出，目前支持向量機(jī)有著幾方面的研究熱點(diǎn)：核函數(shù)的構(gòu)造和參數(shù)的選擇；支持向量機(jī)從兩類問題向多類問題的推廣；更多的應(yīng)用領(lǐng)域的推廣；與目前其它機(jī)器學(xué)習(xí)方法的融合；與數(shù)據(jù)預(yù)處理（樣本的重要度、屬性的重要度、特征選擇等）方法的結(jié)合。

　　參考文獻(xiàn)

　�。�1］@張學(xué)工.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)［M］.北京：清華大學(xué)出版社，2000.

　�。�2］@NelloCristianini,JohnShawe-Taylor.支持向量機(jī)導(dǎo)論［M］.北京：電子工業(yè)出版社，2004.

【支持向量機(jī)在數(shù)據(jù)挖掘中的應(yīng)用研究論文】相關(guān)文章：

支持向量機(jī)在大氣污染預(yù)報中的應(yīng)用研究05-01

支持向量機(jī)在機(jī)載設(shè)備故障診斷及預(yù)測中的應(yīng)用研究04-26

支持向量機(jī)在害蟲預(yù)測預(yù)報中的應(yīng)用05-02

支持向量機(jī)在飛機(jī)狀態(tài)監(jiān)控中的應(yīng)用04-27

支持向量機(jī)在短期氣候預(yù)測中的應(yīng)用04-30

支持向量機(jī)在海洋隨機(jī)資料分析中的應(yīng)用05-02

支持向量機(jī)在城市震后火災(zāi)損失預(yù)測中的應(yīng)用05-02

支持向量機(jī)在大慶齊家凹陷測井解釋中的應(yīng)用04-29

數(shù)據(jù)挖掘論文04-29

數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究04-26

一级毛片免费不卡在线视频,国产日批视频免费在线观看,菠萝菠萝蜜在线视频免费视频,欧美日韩亚洲无线码在线观看,久久精品这里精品,国产成人综合手机在线播放,色噜噜狠狠狠综合曰曰曰,琪琪视频

支持向量機(jī)在數(shù)據(jù)挖掘中的應(yīng)用研究論文