【原】人工智能：語音識別技術(shù)介紹

IT技術(shù)分享社區(qū) 2022-12-01 發(fā)布于江蘇

展開全文

今天給大家介紹一下關(guān)于語音識別相關(guān)的知識,，希望對大家有所幫助！

1,、什么是語音

語音指的是人類通過發(fā)聲器官發(fā)出來具有一定意義,、用來溝通交流的聲音。

計算機中語音存儲：以波形文件的方式存儲,，通過波形反映語音的變化,，從而可以獲取音強、音長等參數(shù)信息,。

音域參數(shù)：傅利葉譜,、梅爾頻率到譜系數(shù)，主要用來提取語音內(nèi)容以及音色的差別,，用來更進一步辨別語音信息,。

2、什么是語音識別

語音識別簡單來說就是把語音內(nèi)容自動轉(zhuǎn)換為文字的過程,，是人與機器交互的一種技術(shù),。

涉及領(lǐng)域：聲學(xué)、人工智能,、數(shù)字信號處理,、心理學(xué)等方面。

語音識別的輸入：對一段聲音文件進行播放的序列,。

語音識別的輸出：輸出的結(jié)果是一段文本序列,。

3,、語音識別的原理

語音識別需要經(jīng)過特征提取、聲學(xué)模型,、語音模型、語音解碼和搜索算法四個部分,。

特征提?。喊岩治龅男盘枏淖钤夹盘柼崛〕鰜恚@個階段主要是對語音的幅度標準化,、頻響校正,、分幀、加窗,、始末端點檢測等預(yù)處理操作,，為聲學(xué)模型提供需要特征向量。

聲學(xué)模型：依靠聲學(xué)模型進行語音參數(shù)分析（語音共振峰頻率,、幅度等）和對語音的線性預(yù)測參數(shù)進行分析,。

語言模型：根據(jù)相關(guān)語言學(xué)理論，計算出聲音片段可能詞組序列的概率,。

語音解碼和搜索算法：根據(jù)聲學(xué)模型+發(fā)音詞典+語音模型構(gòu)建的搜索空間,，找到最合適的路徑。解碼完成后最終輸出文本,。

4,、語音識別系統(tǒng)的組成

一個完整的語音識別系統(tǒng)包括：預(yù)處理、特征提取,、聲學(xué)模型訓(xùn)練,、語言模型訓(xùn)練、語音解碼器,。

4.1 預(yù)處理

對輸入的原始聲音信號進行處理,，過濾掉其中的背景噪音、非重要信息,，還要對找到語音信號的開始和結(jié)束,、語音分幀、提升高頻部分的信號等操作,。

4.2 特征提取

最常用的特征提取方法為梅爾頓到譜系數(shù)(MFCC),因為它擁有良好的抗噪性和健壯性,。

4.3 聲學(xué)模型訓(xùn)練

根據(jù)懸戀語音庫的特征參數(shù)訓(xùn)練出聲學(xué)模型參數(shù)，從而可以在識別時與聲學(xué)模型進行匹配得到相應(yīng)結(jié)果,。目前主流語音識別系統(tǒng)一般都會采用HMM進行聲學(xué)模型建模,。

4.4 語言模型訓(xùn)練

用來預(yù)測哪個詞序列正確的可能性更大。

4.5 語音解碼器

解碼器也就是語音識別技術(shù)中的識別過程,，根據(jù)輸入的語音信號,，然后和訓(xùn)練好的HMM聲學(xué)模型,、語言模型、發(fā)音字典建立一個搜索空間,，根據(jù)搜索算法找到最合適的路徑,。從而找到最合適的詞串。

5,、語音識別的使用場景

語音識別在日常生活中使用非常廣泛主要分為封閉式和開放式應(yīng)用,。

封閉式應(yīng)用：主要指針對特定控制指令的應(yīng)用。

比如常見的有智能家居比如通過語音指令控制燈開關(guān),、熱水器開關(guān)溫度調(diào)節(jié),、打開空調(diào)等，大大豐富了我們?nèi)粘５纳睿?/span>

開放式應(yīng)用：開放式主要是廠商提供語音識別服務(wù),，一般會公有云或者私有云的方式部署提供對應(yīng)的SDK,，讓使用服務(wù)的客戶進行語音識別服務(wù)的調(diào)用。

常見的場景有輸入法,、會議字幕實時輸出,、視頻剪輯字幕配置等場景。

大數(shù)據(jù)優(yōu)秀博客推薦

IT技術(shù)分享社區(qū)

CSDN：https://blog.csdn.net/xishining

個人博客網(wǎng)站：https://

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自： IT技術(shù)分享社區(qū) > 《人工智能》

舉報/認領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

IT技術(shù)分享社區(qū)

科技領(lǐng)域優(yōu)質(zhì)作者

關(guān)注對話

TA的最新館藏

電腦技巧：推薦一款護眼神器小智護眼寶,，呵護你的眼睛
Directory Monitor：全方位監(jiān)控文件系統(tǒng)變動的專業(yè)利器（附下載）
Redmi K60至尊版搭載頂級配置,，價格2399，太值了,！ RedmiK...
Redmi K60至尊版搭載頂級配置,，價格2399，太值了,！
大屏控必備神器：vivo Pad3 Pro等你來搶
電腦軟件：推薦一款功能強大的磁盤分析工具——Files Inspector

喜歡該文的人也喜歡更多

熱門閱讀換一換

久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久