單片機(jī)開發(fā)
- 首頁 >> 電子技術(shù) >> 單片機(jī)開發(fā)
單片機(jī)語音處理技術(shù)
單片機(jī)語音處理技術(shù)應(yīng)用
多媒體技術(shù)是現(xiàn)代計(jì)算機(jī)應(yīng)用技術(shù)中極其活躍的一門新興技術(shù),音像處理是多媒體技術(shù)的核心研究對象,語音處理是聲音處理技術(shù)中極為重要的實(shí)用技術(shù)。語音處理技術(shù)的基礎(chǔ)是語音學(xué)和數(shù)字信號處理,它包括語音分析技術(shù)、語音存儲技術(shù)、語音識別技術(shù)和語音合成(重現(xiàn))技術(shù)。本文以凌陽SPCE061A為例,對單片機(jī)語音處理技術(shù)方面的原理與應(yīng)用進(jìn)行了探討。
一、音頻處理
計(jì)算機(jī)處理音頻主要采用幾項(xiàng)技術(shù):采樣與量化技術(shù)、音頻保存技術(shù)、音頻壓縮編碼技術(shù)、音頻重現(xiàn)與辨識技術(shù)。采樣與量化是將自然界中聲音按一定要求采集到計(jì)算機(jī)中,是聲音處理技術(shù)的基礎(chǔ)。可聽音頻的頻率在20Hz~20kHz范圍內(nèi),語音的頻率一般在60Hz~500Hz范圍內(nèi)。
音頻可分為波形聲音、語音和音樂三種。與任何聲音一樣,語音也表現(xiàn)為波形聲音,但波形聲音表示不出語言、語音的內(nèi)涵。語音是對講話聲音的一次抽象,是語言的載體,是人類社會特有的一種信息系統(tǒng)。音樂是特殊的聲音,是聲音的一個(gè)微弱子集,是規(guī)范化符號化了的聲音。但音樂不能對所有的聲音進(jìn)行符號化。樂譜是符號化聲音的符號組,不同的組合表示比單個(gè)號更復(fù)雜的聲音信息。
計(jì)算機(jī)處理音頻時(shí)首先要將模擬的(連續(xù)的)聲音波形數(shù)字化(離散化),這要通過A/D轉(zhuǎn)換器來實(shí)現(xiàn),轉(zhuǎn)換后的音頻稱為數(shù)字音頻,它的質(zhì)量取決于A/D轉(zhuǎn)換器的轉(zhuǎn)換速率和分辨率,速率越高表征單位時(shí)間內(nèi)采集到的數(shù)據(jù)越多,分辨率越高表征采集到的數(shù)據(jù)精度越高,所以音頻處理中對音頻的采樣頻率和量化位數(shù)是兩個(gè)重要參數(shù)。采集到的音頻信號由音頻文件保存。音頻文件分為兩類:聲音文件和MIDI文件。
二、單片機(jī)語音處理技術(shù)
單片機(jī)語音處理方面,通常解決的方案采用兩個(gè)途徑:一是對單片機(jī)本身進(jìn)行擴(kuò)展設(shè)計(jì),將語音處理功能模塊直接置于單片機(jī)內(nèi);二是借助于專門的語音處理芯片擴(kuò)展單片機(jī)的功能。由于專門的語音處理芯片系列較多且功能單一,實(shí)現(xiàn)一個(gè)完整的系統(tǒng)需要增加很多的外圍器件,因而在使用上不很方便,所以比較這兩種方案,第一種具有明顯的優(yōu)勢,但作為通用處理器而言,這種方案是不妥當(dāng)?shù)摹?br/>
專為語音識別和語音處理應(yīng)用領(lǐng)域設(shè)計(jì)的芯片需有一顆高速DSP核心處理器承擔(dān)控制和運(yùn)算任務(wù),還需適量的片內(nèi)集成ROM/RAM存儲器用來存儲應(yīng)用程序、驅(qū)動程序、各種數(shù)據(jù)和語音識別、語音壓縮算法及算法所用常數(shù)表等,這增大了芯片設(shè)計(jì)與制造的成本。由于單片機(jī)語音處理芯片在片內(nèi)集成的ROM/RAM存儲器不可能很大,因此單片機(jī)不適合用于大規(guī)模語音處理系統(tǒng)。
三、凌陽SPCE061A單片機(jī)語音處理技術(shù)
3.1凌陽SPCE061A單片機(jī)
凌陽SPCE061A是一款16位μ’nSP結(jié)構(gòu)的微控制器。該芯片帶有硬件乘法器,能夠?qū)崿F(xiàn)乘法運(yùn)算、內(nèi)積運(yùn)算等復(fù)雜的運(yùn)算。凌陽SPCE061A單片機(jī)設(shè)計(jì)先進(jìn),特點(diǎn)突出,易學(xué)易用,體現(xiàn)了現(xiàn)代微控制器工業(yè)發(fā)展的新趨勢。
3.2凌陽SPCE061A單片機(jī)語音處理的實(shí)現(xiàn)
凌陽SPCE061A將語音處理相關(guān)各功能做成函數(shù)模塊,通過API調(diào)用來實(shí)現(xiàn)。這些函數(shù)分為兩類:用于音頻資料播放的凌陽音頻編碼(SACM)類和用于辨識語音的語音識別(BSR)類。
對輸入生成的WAVE文件按不同的壓縮算法壓縮成SACM_A2000或SACM_S480等相應(yīng)語音資料后,就可利用SACM-LIB庫對這些資料進(jìn)行處理。該庫將A/D、編碼、解碼、存儲及D/A做成相應(yīng)的模塊,每個(gè)模塊都有其應(yīng)用程序接口API函數(shù),調(diào)用對應(yīng)函數(shù)即可實(shí)現(xiàn)各自功能。
如針對特定人語音辨識,SACM-LIB庫中提供了包括C語言和匯編語言兩種格式定義的API函數(shù),常用語音辨識API函數(shù)有:
(1)SRAM初始化函數(shù)int BSR-DeleteSD-Group(int);(2)訓(xùn)練函數(shù)int BSR-Train(int CommandID,int TrainMode);(3)識別初始化函數(shù)int BSR-InitRecognizer(int AudioSource);(4)獲取識別結(jié)果函數(shù)int BSR-GetResult(void);(5)停止識別函數(shù)void BSR-StopRecognizer(void);(6)識別中斷程序-BSR-FIQ-Routine;
配合語音壓縮及播放的相關(guān)API函數(shù),即可構(gòu)成一個(gè)完整的語音應(yīng)用系統(tǒng)。
總結(jié)
語音處理技術(shù)對下一代多模式交互人機(jī)界面設(shè)計(jì)技術(shù)有重要影響,隨著消費(fèi)類電子產(chǎn)品中對于高性能、高穩(wěn)定性的語音接口需求的快速增加,單片機(jī)及嵌入式語音處理技術(shù)在快速發(fā)展。然而,語音處理技術(shù)解決方案目前還普遍存在一些問題,隨著軟硬件技術(shù)的進(jìn)一步研究,這些問題一定會在不久的將來得到合理解決,語音處理技術(shù)將為計(jì)算機(jī)的深入應(yīng)用帶來更加廣闊的空間。
以上就是我們深圳市組創(chuàng)微電子有限公司為您介紹的單片機(jī)語音處理技術(shù)應(yīng)用。我們有豐富的智能電子產(chǎn)品定制開發(fā)經(jīng)驗(yàn),可以盡快評估開發(fā)周期與IC價(jià)格,也可以核算PCBA報(bào)價(jià)。我們是松翰單片機(jī)代理商、應(yīng)廣單片機(jī)代理商,出售并開發(fā)sonix與應(yīng)廣的MCU與語音IC方案。我們代理并開發(fā)杰理、安凱、全志、realtek等系列的IC與方案,還開發(fā)BLE藍(lán)牙IC、雙模藍(lán)牙模塊、wifi模塊、物聯(lián)網(wǎng)模塊。我們的擁有硬件設(shè)計(jì)與軟件開發(fā)能力。涵蓋了電路設(shè)計(jì)、PCB設(shè)計(jì)、單片機(jī)開發(fā)、軟件定制開發(fā)、APP定制開發(fā)、微信公眾號開發(fā)、語音識別技術(shù)、藍(lán)牙開發(fā)、wifi技術(shù)等。還可以承接智能電子產(chǎn)品研發(fā)、家用電器方案設(shè)計(jì)、美容儀器開發(fā)、物聯(lián)網(wǎng)應(yīng)用開發(fā)、智能家居方案設(shè)計(jì)、TWS耳機(jī)開發(fā)、藍(lán)牙耳機(jī)音箱開發(fā)、兒童玩具方案開發(fā)、電子教育產(chǎn)品研發(fā)。
- 返回頂部