有關(guān)人臉識(shí)別技術(shù)論文
摘要:人臉識(shí)別技術(shù)(Face Recognition Technology,F(xiàn)RT)是近年來(lái)模式識(shí)別、圖像處理以及計(jì)算機(jī)視覺(jué)等領(lǐng)域的熟點(diǎn)研究課題之一。本文重點(diǎn)對(duì)現(xiàn)有的人臉檢測(cè)與識(shí)別方法及研究進(jìn)行總結(jié),分析和比較各種識(shí)別方法優(yōu)缺點(diǎn),討論了其中的關(guān)鍵技術(shù)及發(fā)展前景。
關(guān)鍵詞;人臉識(shí)別 人臉檢測(cè) 特征提取
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2008)ll(a)-0004-02
1引言
隨著計(jì)算機(jī)的普及和應(yīng)用,對(duì)個(gè)人身份的自動(dòng)鑒定提出了越來(lái)越多的要求。雖然,已經(jīng)存在一些相當(dāng)可靠的身份驗(yàn)證方法如指紋,虹膜識(shí)別等,但是這些方法都需要參與者的某種程度的合作,而人臉識(shí)別則無(wú)須參與者太多的合作,而且具有直接、友好、方便的特點(diǎn),是進(jìn)行身份確認(rèn)最自然直接的手段。人臉識(shí)別技術(shù)(Face Recognition Technology,F(xiàn)RT)就是用計(jì)算機(jī)對(duì)人臉圖象進(jìn)行特征提取和識(shí)別的模式識(shí)別技術(shù)。同時(shí),它融合計(jì)算機(jī)圖形學(xué)、模式識(shí)別、圖象處理、計(jì)算機(jī)視覺(jué)和人工智能等多個(gè)學(xué)科的理論和方法。
2技術(shù)發(fā)展和研究現(xiàn)狀
人臉識(shí)別研究發(fā)展大致可分為三個(gè)階段:第一階段主要研究人臉識(shí)別所需要的面部特征,這一階段工作的特點(diǎn)是識(shí)別過(guò)程全部依賴于操作人員。第二階段是人機(jī)交互識(shí)別階段。用幾何特征參數(shù)來(lái)表示人臉正面圖像:Goldstion.Harmon和Lesk用21維特征矢量表示了人臉面部特征,并設(shè)計(jì)了基于這一特征表示法的識(shí)別系統(tǒng);也有采用統(tǒng)計(jì)識(shí)別的方法的研究者:用歐式距離來(lái)表征人臉特征,如嘴唇和鼻之間的距離,嘴唇的高度等。這類方法需要利用操作員的先驗(yàn)知識(shí),需要人的干預(yù)。第三階段才是真正的機(jī)器自動(dòng)識(shí)別階段。隨著高速度性能計(jì)算機(jī)的發(fā)展,人臉識(shí)別方法有了較大的突破,提出了多種機(jī)器全自動(dòng)識(shí)別系統(tǒng)。我國(guó)人臉識(shí)別技術(shù)的研究雖然起步較晚,但發(fā)展較快。中國(guó)科學(xué)院計(jì)算技術(shù)研究所,清華大學(xué),東南大學(xué),上海交通大學(xué),復(fù)旦大學(xué)等,都已取得了一定成果。
3廣泛應(yīng)用的人臉檢測(cè)與識(shí)別算法
3.1基于可視特征的方法
基于可視特征的方法主要是利用從人臉的表觀特征總結(jié)出來(lái)的先驗(yàn)知識(shí),使用規(guī)則來(lái)描述人臉的幾何分布、顏色、紋理等可見(jiàn)特征,從而作為人臉檢測(cè)和識(shí)別的依據(jù)。
3.1.1幾何特征
人臉的幾何特征包括臉型特征以及五官在臉上分布的幾何特征。提取特征時(shí)往往要用到人臉結(jié)構(gòu)的一些先驗(yàn)知識(shí)。識(shí)別所采用的幾何特征是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,本質(zhì)上是特征矢量之間的匹配,其分量通常包括人瞼指定兩點(diǎn)間的歐式距離、曲率、角度等。基于幾何特征的識(shí)別方法比較簡(jiǎn)單、容易理解,但沒(méi)有形成統(tǒng)一的特征提取標(biāo)準(zhǔn);從圖像中抽取穩(wěn)定的特征較困難,特別是特征受到遮擋時(shí);對(duì)較大的表情變化或姿態(tài)變化的魯棒性較差。幾何特征還可能由于光照、表情、遮擋等原因而被破壞,另外由人臉陰影所形成的邊緣可能對(duì)幾何特征的邊緣帶來(lái)不良影響。
3.1.2紋理特征
和指紋相似,每張人臉都有其特殊紋理特性,可以基于SGLD(空間灰度依賴矩陣)建立由一組不等式組成的人臉紋理模型,實(shí)現(xiàn)人臉檢測(cè)與定位。
3.1.3顏色特征
目前已有RGB,HSV(HSI),YCrCb,YIQ,YES,CIE等顏色空間被用于標(biāo)記人臉的膚色。膚色算法有如下的優(yōu)點(diǎn):(1)可以在普通工作站上以幀速率來(lái)實(shí)現(xiàn)人臉區(qū)域分割,(2)膚色分割算法沒(méi)有使用特殊的臉部特征,因此頭部方向和姿態(tài)的變化不會(huì)影響對(duì)于膚色區(qū)域的確定;(3)允許被跟蹤對(duì)象自由活動(dòng),減少對(duì)環(huán)境的限制。但是由于光源的.顏色以及光照的角度不同所造成的高亮和陰影等諸多因素的影響,利用顏色分割人臉仍然一個(gè)非常困難的問(wèn)題。
3.2基于模板的方法
很多人臉檢測(cè)系統(tǒng)是基于模板的,模板匹配的方法主要是通過(guò)計(jì)算模板和圖像之間的相關(guān)性來(lái)實(shí)現(xiàn)識(shí)別功能。
3.2.1通用模板匹配
在模板匹配中,人臉標(biāo)準(zhǔn)模板由人工來(lái)定義。對(duì)于輸入圖像,分別計(jì)算標(biāo)準(zhǔn)模板中的臉部輪廓,眼睛,鼻子等的相關(guān)值,由相關(guān)程度來(lái)決定人臉的存在。這種方法的特點(diǎn)是實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單,但是模板匹配方法在很多場(chǎng)合并不適用,因?yàn)楹?jiǎn)單的模板不能適應(yīng)尺寸、姿態(tài)和形狀的變化。因而實(shí)際應(yīng)用中多數(shù)采用多分辨率、多尺度、多子模板和可變形模板實(shí)現(xiàn)模板匹配,以增加適應(yīng)性和準(zhǔn)確性。
3.2.2可變形模板匹配
可變形模板法可以說(shuō)是幾何特征方法的改進(jìn),其基本思想是:設(shè)計(jì)參數(shù)可調(diào)的器官模型,即可變形模板,定義一個(gè)能量函數(shù),通過(guò)調(diào)整模型參數(shù)使得能量函數(shù)最小化,此時(shí)的模型參數(shù)即為對(duì)象的幾何特征?勺冃文0宸椒ù嬖趦蓚(gè)問(wèn)題,一是能量函數(shù)中各種代價(jià)的加權(quán)系數(shù)只能由經(jīng)驗(yàn)確定,難以推廣,二是能量函數(shù)的優(yōu)化過(guò)程十分耗時(shí),難以實(shí)際應(yīng)用。
3.3基于子空間方法
常用的線性子空間方法有:本征子空間、區(qū)別子空間、獨(dú)立分量子空間等。此外,還有局部特征分析法、因子分析法等。這些方法也分別被擴(kuò)展到混合線性子空間和非線性子空間。
3.4基于機(jī)器學(xué)習(xí)的方法
在基于幾何特征的方法和基于模板的方法中,人臉的特征都是由專家預(yù)先定義好的.而在基于機(jī)器學(xué)習(xí)的方法中,人臉的特征或類別是利用統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)的技術(shù)從樣本中學(xué)習(xí)來(lái)的。學(xué)習(xí)所得的人臉特征或類別存在于由各種算法所保證的分布規(guī)律、模型和判別函數(shù)中,并被用于人臉的檢測(cè)和識(shí)別中。
3.4.1神經(jīng)網(wǎng)絡(luò)方法(ANN)
神經(jīng)網(wǎng)絡(luò)技術(shù)(ANN,Artificial Neural Networks)作為一類模式識(shí)別方法近年來(lái)發(fā)展迅速。神經(jīng)網(wǎng)絡(luò)可視為大量相聯(lián)的簡(jiǎn)單處理器(神經(jīng)元)構(gòu)成的大規(guī)模并行計(jì)算系統(tǒng)。神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)復(fù)雜的非線性輸入輸出關(guān)系的能力,對(duì)于模型和規(guī)則的依賴性較低,可以利用訓(xùn)練過(guò)程來(lái)適應(yīng)數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)識(shí)別法是將人臉直接用灰度圖(二維矩陣)表征,利用了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力及分類能力。這種方法的優(yōu)勢(shì)在于保存了人臉圖像中的材質(zhì)信息及細(xì)微的形狀信息,同時(shí)避免了較為復(fù)雜的特征提取工作。而且,由于圖像被整體輸入,符合格氏塔(Gestalt)心理學(xué)中對(duì)人類識(shí)別能力的解釋;谏窠(jīng)網(wǎng)絡(luò)的方法的特點(diǎn)是信息處理方式是并行而非串行,并且信息編碼的存儲(chǔ)方式是分布式。
3.4.2支持向量機(jī)(SVM)
支持向量機(jī)(SVM,Support Vector Machines)是一類新型的基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法。由于其出色的學(xué)習(xí)性能,該技術(shù)已經(jīng)成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)。SVM分類器是一種線性分類器,它選擇可分離的超平面,以使不可見(jiàn)的測(cè)試模式的預(yù)知分類錯(cuò)誤最小,目的是使期望總體誤差的上邊界最小。它是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的方法,較之于基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的人工神經(jīng)網(wǎng)絡(luò),一些難以逾越的問(wèn)題,如模型的選擇和過(guò)學(xué)習(xí)問(wèn)題、非線性和維數(shù)災(zāi)難問(wèn)題、局部極小點(diǎn)問(wèn)題等都得到了很大程度的解決。
3.4.3貝葉斯方法(Bayes)
貝葉斯決策方法是統(tǒng)計(jì)模式識(shí)別中的一個(gè)基本方法。將兩幅圖像灰度差4 =Ij-Ik作為模式矢量,當(dāng)其中的人臉屬于同一個(gè)人時(shí)?
4為類內(nèi)模式婦,,屬于不同人時(shí)為類間模式以。。采用最大后驗(yàn)概率準(zhǔn)則能夠較好的解決此類模式分類問(wèn)題。不過(guò),人臉識(shí)別不同于一般的模式分類,不僅要判斷待檢測(cè)圖像x與數(shù)據(jù)庫(kù)中的圖像Y是屬于類內(nèi)模式還是屬于類間模式,還要判斷圖像x與圖像Y是否屬于同一個(gè)人。如果判斷出X與數(shù)據(jù)庫(kù)中的多個(gè)lr都屬于同一個(gè)人,則還需要進(jìn)一步判斷哪一對(duì)匹配最好。因此,該問(wèn)題具有較高的復(fù)雜性。
3.4.4隱馬爾科夫模型(HMM)
隱馬爾可夫模型是用于描述信號(hào)統(tǒng)計(jì)特性的統(tǒng)計(jì)模型。HMM使用馬爾可夫鏈來(lái)模擬信號(hào)統(tǒng)計(jì)特征的變化,而這種變化是間接的通過(guò)觀察序列來(lái)描述的,因此,隱馬爾可夫過(guò)程是一個(gè)雙重的隨機(jī)過(guò)程。其中之一是馬爾可夫鏈,這是基本隨機(jī)過(guò)程,它描述狀態(tài)的轉(zhuǎn)移。另一個(gè)隨機(jī)過(guò)程描述狀態(tài)和觀測(cè)值之聞的統(tǒng)計(jì)對(duì)應(yīng)關(guān)系。在HMM中,節(jié)點(diǎn)表示狀態(tài),有向邊表示狀態(tài)之間的轉(zhuǎn)移,一個(gè)狀態(tài)可以有特征空間中的任意特征,對(duì)同一個(gè)特征,不同狀態(tài)表現(xiàn)出這一特征的概率不同。由于HMM是一個(gè)統(tǒng)計(jì)模型,對(duì)于同一特征序列,可能會(huì)對(duì)應(yīng)許多狀態(tài)序列,特征序列與狀態(tài)序列之間的對(duì)應(yīng)關(guān)系是非常正確的。
4展望
目前的各種人臉識(shí)別技術(shù)方法都有各自優(yōu)缺點(diǎn),因此,許多人傾向于將多種方法綜合起來(lái)運(yùn)用。并且,人臉識(shí)別是人臉視覺(jué)的獨(dú)特過(guò)程,因此必須結(jié)合生理學(xué)和心理學(xué)的研究成果。同時(shí),如何與其他生物特征識(shí)別結(jié)合以提高識(shí)別率也是今后研究的方向。我們相信隨著計(jì)算機(jī)技術(shù)和生物識(shí)別技術(shù)的發(fā)展,以及人臉的檢測(cè)與識(shí)別技術(shù)的不斷完善,在不遠(yuǎn)的將來(lái),一套準(zhǔn)確而高效的人臉檢測(cè)與識(shí)別系統(tǒng)就會(huì)呈現(xiàn)在我們的面前。
參考文獻(xiàn)
[l]周德龍,張曉華,劉博等.JDL大規(guī)模人臉圖像數(shù)據(jù)庫(kù)介紹[A].生物識(shí)別研究新進(jìn)展(2)[C].北京:清華大學(xué)出版社,2003:118-120.
[2]肖冰,王映輝,人臉識(shí)別研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2005,8(1):1-5.
[3]陳鍛生,劉政凱.膚色檢測(cè)技術(shù)綜述[J].計(jì)算機(jī)學(xué)報(bào),2006,29(2):194-203.
[4]邊肇祺,張學(xué)工.模式識(shí)別(第2版)[M].北京:清華大學(xué)出版社,2000:1-50.
[5]趙慧琳,王林泉,葛元.人臉圖像定位與標(biāo)準(zhǔn)化算法[J].計(jì)算機(jī)工程,2003,29(22):158-160.
[6]樊振萍.人臉檢測(cè)與識(shí)別技術(shù)綜述[J].電腦知識(shí)與技術(shù),2008,07(5):1292-1295.
【人臉識(shí)別技術(shù)論文】相關(guān)文章:
人臉識(shí)別技術(shù)新突破:復(fù)雜場(chǎng)景識(shí)別率遠(yuǎn)超人眼-識(shí)別-人臉08-08
超聲波人臉識(shí)別方法研究07-11
Win10系統(tǒng)使用人臉識(shí)別技術(shù)及必備條件 -電腦資料01-01
淺談基于PCA算法的人臉識(shí)別的圖片搜索引擎論文10-21
空間物資管理系統(tǒng)無(wú)線射頻識(shí)別技術(shù)論文02-13