预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

語音辨識技術於藍芽通訊環境之應用研究ApplicationsofSpeechRecognitiontoBluetoothWirelessCommunications譚旦旭王新富何元傑王冠驊汪千綺高逸竹國立台北科技大學電機工程系Email:HYPERLINK"mailto:thtan@ntut.edu.tw"thtan@ntut.edu.tw摘要本論文探討語音辨識技術應用於藍芽通訊環境的可行性。首先,我們應用藍芽系統於多種距離下錄製2男3女的測試語料,並利用HTK模組所訓練的語音參考模型進行模擬實驗。接著我們實作了一套語音控制系統,此系統由藍芽模組、語音辨識模組、控制模組及機械狗組成。模擬與實作系統的測試結果顯示整合藍芽與語音辨識技術的家庭自動化之應用是可行的一個方向。關鍵詞:藍芽、語音辨識、家庭自動化一、簡介經過三十多年來的發展,語音辨識技術已臻成熟的地步[1],目前已有許多語音辨識系統被開發出來,並成功地應用在人類日常生活中,例如我們可以使用語音輸入取代按鍵輸入[2]、以聲控方式撥打手機[3]、及以手機進行語音下單[4]等。由手機、個人電腦、消費性電子以及娛樂性產品等,處處可見語音辨識的應用,語音辨識技術不但使正常人的生活更便利,也可大幅提昇殘障人士的生活品質。家庭自動化是人類一直追求的目標,也陸續有各式各樣的系統被開發出來。但多數仍存在有線的束縛,且控制方式仍多採手動按鍵等缺點,為改善上述情況,本研究擬結合藍芽(Bluetooth)無線通訊及語音辨識(SpeechRecognition)技術以擺脫有線環境的束縛,進一步提昇家庭自動化的品質。目前整合藍芽及語音辨識之研究尚未見文獻探討,故其應用仍屬萌芽期。由於藍芽需要的功率很低且適用於短距離傳輸,因此符合一般家庭環境之需求,若能輔以語音辨識之便利性,將更具應用價值,可為人類在家庭自動化之應用提供更好的解決方案。本論文第二節將介紹藍芽無線技術。第三節將敘述語音辨識技術。為了驗證語音辨識於藍芽通訊環境之可行性,第四節將以電腦軟體評估語音辨識率並分析其效能。第五節實作一套無線藍芽語音辨識系統,以語音控制機械狗。第六節為結論。二、藍芽藍芽[5]是一種適用於短距離傳輸(10~100公尺)的低功率無線通訊技術,其使用的2.4GHz(2.402~2.480GHz)頻道為全世界通用的免費ISM(Industrial,ScientificandMedical)頻帶。為解決公用頻道的干擾問題,藍芽使用跳頻(FrequencyHopping)技術,其工作的2.402~2.480GHz頻帶被切割成79個各為1MHz的通道(channel),並以隨機方式選擇通道進行通訊,一般傳輸狀況下跳頻次數為1,600次/秒,每個時槽(timeslot)佔625μs。藍芽採用分時雙工(Time-Division-Duplex;TDD)及GFSK(GaussianFrequencyShiftKeying)調變技術。藍芽以SCO(SynchronousConnection-Oriented)通道傳送語音,SCO連線屬電路交換的同步傳輸型態,每一條SCO支援64Kbit/s的語音通話,一旦建立SCO通道,Master和Slave即可直接發送SCO封包,進行單點對單點的對稱連線服務。藍芽的興起對目前廣被採用的紅外線傳輸技術影響甚鉅,雖然紅外線擁有低成本的優勢,但紅外線傳輸受到須在視線範圍內連線的限制,藍芽則無此限制,且藍芽價格已逐年下降至趨近合理範圍,因此漸有取代紅外線的趨勢。表1比較藍芽與紅外線技術之差異[5-8]。三、語音辨識技術語音辨識技術主要包括訓練及測試兩大部分,在訓練部分主要是由語音中所萃取出之特徵參數建立相關之語音參考模型,測試部分則是根據訓練所得之模型對測試語料進行辨識。本論文中,語音特徵參數的擷取方法是採用描述人耳聽覺特性的梅爾頻率倒頻譜係數(Mel-FrequencyCepstrumCoefficients),其特徵參數的相關變數設定為32ms的音框長度、10ms的音框位移長度、Filter-Bank的階數為26階、Cepstrum階數為13階(包含語音能量參數),且採用HammingWindows[1]。而語音模型則是採用隱藏式馬可夫模型(HiddenMarkovModel,HMM),每一模型所代表的是一特定音節(Syllable)之語音。而測試階段則是根據最大相似度法則(Maximum-Likelihood),利用維特比演算法(ViterbiAlgorithm)進行辨識。本論文中語音模型的訓練是採用微軟公司所免費分享之HTK(Hi