- 相關(guān)推薦
基于HMM的語音識別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用
摘要:介紹語音識別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用狀況與發(fā)展,以及在嵌入式系統(tǒng)中使用HMM語音識別算法的優(yōu)點(diǎn),并對基于HMM語音識別技術(shù)的系統(tǒng)進(jìn)行介紹。關(guān)鍵詞:SoC芯片 HMM 語音識別 嵌入式系統(tǒng)
語音識別ASR(Automatic Speech Recognition)系統(tǒng)的實(shí)用化研究是近十年語音識別研究的一個(gè)主要方向。近年來,消費(fèi)類電子產(chǎn)品對低成本、高穩(wěn)健性的語音識別片上系統(tǒng)的需求快速增加,語音識別系統(tǒng)大量地從實(shí)驗(yàn)室的PC平臺轉(zhuǎn)移到嵌入式設(shè)備中。
語音識別技術(shù)目前在嵌入式系統(tǒng)中的應(yīng)用主要為語音命令控制,它使得原本需要手工操作的工作用語音就可以方便地完成。語音命令控制可廣泛用于家電語音遙控、玩具、智能儀器及移動(dòng)電話等便攜設(shè)備中。使用語音作為人機(jī)交互的途徑對于使用者來說是最自然的一種方式,同時(shí)設(shè)備的小型化也要求省略鍵盤以節(jié)省體積。
嵌入式設(shè)備通常針對特定應(yīng)用而設(shè)計(jì),只需要對幾十個(gè)詞的命令進(jìn)行識別,屬于小詞匯量語音識別系統(tǒng)。因此在語音識別技術(shù)的要求不在于大詞匯量和連續(xù)語音識別,而在于識別的準(zhǔn)確性與穩(wěn)健性。
對于嵌入式系統(tǒng)而言,還有許多其它因素需要考慮。首先是成本,由于成本的限制,一般使用定點(diǎn)DSP,有時(shí)甚至只能考慮使用MPU,這意味著算法的復(fù)雜度受到限制;其次,嵌入式系統(tǒng)對體積有嚴(yán)格的限制,這就需要一個(gè)高度集成的硬件平臺,因此,SoC(System on Chip)開始在語音識別領(lǐng)域嶄露頭角。SoC結(jié)構(gòu)的嵌入式系統(tǒng)大大減少了芯片數(shù)量,能夠提供高集成度和相對低成本的解決方案,同時(shí)也使得系統(tǒng)的可靠性大為提高。
語音識別片上系統(tǒng)是系統(tǒng)級的集成芯片。它不只是把功能復(fù)雜的若干個(gè)數(shù)字邏輯電路放入同一個(gè)芯片,做成一個(gè)完整的單片數(shù)字系統(tǒng),而且在芯片中還應(yīng)包括其它類型的電子功能器件,如模擬器件(如ADC/DAC)和存儲器。
筆者使用SoC芯片實(shí)現(xiàn)了一個(gè)穩(wěn)定、可靠、高性能的嵌入式語音識別系統(tǒng)。包括一套全定點(diǎn)的DHMM和CHMM嵌入式語音識別算法和硬件系統(tǒng)。
1 硬件平臺
本識別系統(tǒng)是在與Infineon公司合作開發(fā)的芯片UniSpeech上實(shí)現(xiàn)的。UniSpeech芯片是為語音信號處理開發(fā)的專用芯片,采用0.18μm工藝生產(chǎn)。它將雙核(DSP+MCU)、存儲器、模擬處理單元(ADC與DAC)集成在一個(gè)芯片中,構(gòu)成了一種語音處理SoC芯片。這種芯片的設(shè)計(jì)思想主要是為語音識別和語音壓縮編碼領(lǐng)域提供一個(gè)低成本、高可靠性的硬件平臺。
該芯片為語音識別算法提供了相應(yīng)的存儲量和運(yùn)算能力。包括一個(gè)內(nèi)存控制單元MMU(Memory Management Unit)和104KB的片上RAM。其DSP核為16位
[1] [2] [3] [4] [5]
【基于HMM的語音識別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用】相關(guān)文章:
嵌入式系統(tǒng)與通信技術(shù)在汽車安全中的應(yīng)用05-02
基于微控技術(shù)的機(jī)載語音告警系統(tǒng)設(shè)計(jì)04-28
基于B/S的WebGIS技術(shù)在地質(zhì)信息系統(tǒng)中的應(yīng)用05-03
基于車輛號牌自動(dòng)識別技術(shù)在港口的設(shè)計(jì)與應(yīng)用04-27
圖像識別在目標(biāo)自動(dòng)識別系統(tǒng)中的應(yīng)用05-03
基于信息融合技術(shù)的汽車故障模式識別系統(tǒng)04-27
自動(dòng)語音外呼系統(tǒng)在氣象聲訊服務(wù)中的應(yīng)用04-28