语音识别概论 _语音识别

语音识别是一门综合性学科，涉及的领域非常广泛，包括声学、语音学、语言学、信号处理、概率统计、信息论、模式识别和深度学习等。语音识别的基础理论包括语音的产生和感知过程、语音信号基础知识、语音特征提取等，关键技术包括高斯混合模型 ( Gaussian Mixture Model，GMM )、隐马尔可夫模型 ( Hidden Markov Model，HMM )、深度神经网络 ( Deep Neural Network，DNN )，以及基于这些模型形成的GMM-HMM、DNN-HMM和端到端 ( End-to-End，E2E ) 系统。语言模型和解码器也非常关键，直接影响语音识别实际应用的效果。
为了让读者更好地理解语音信号的特性，接下来我们首先介绍语音的产生和感知机制。
01
语音的产生和感知
如图1-1所示，人的发音器官包括：肺、气管、声带、喉、咽、鼻腔、口腔和唇。肺部产生的气流冲击声带，产生振动。声带每开启和闭合一次的时间是一个基音周期 ( Pitch period )

语音识别概论

推荐阅读

穿搭|女神朴信惠和崔泰俊公布恋情，原来信惠欧尼私底下这么穿

“暑期托管班”值得提倡

「中国江苏网」【新春走基层】汪塘变汪堂新村亮堂堂采煤沉陷地

咖啡粉能当肥料浇花吗咖啡粉能不能用作肥料

桂花|行走丨青龙洞（外三首）

淘宝修改一口价降权多久淘宝店铺随意涨价

大型现代零陵花鼓戏《走啰行啰》剧本研讨会在长沙举行

【丁俊晖】世界斯诺克史上无法超越的三大成就，丁俊晖独占其一，小特前无古人！

科技日报|走出经济困境，巴西拟优先发展生物燃料

境外旅行中，你经历过哪些有惊无险的事

奇瑞汽车|奇瑞的车子质量到底可靠吗？

3DMGAME|《永进》评测：小而精致的国产解谜佳作

手把手教你常用的59个JS类方法

4种花是真正的开花机器，花姿妖娆，姿色艳丽

养胃护胃|糜烂性胃炎分为急性和慢性，症状表现各不同，需及时治疗

『自然美』每天早上喝1杯，补升阳气，阳气足，女人脸色红润，精神足自然美

【叙利亚】叙利亚总统顾问：叙政府不会接受库尔德人自治

IT之家|20 Pro 推送更新，增加指关节截屏功能，荣耀

日本|日本又传来一大噩耗，驻日美军计划全部撤离，白宫也开始坐不住了

[茹锦花开]会对你产生哪些影响？，你周围的数字磁场