计算机专业语音识别方向读博士好不好有啥利弊

谢邀。首先,在国外,ASR领域大多是CS出身的来做,因为最早开始现代的语音识别系统的研究者基本都是美国的计算机学家。 Jelinek 在70年代研发出来的统计模型。用他自己的话来说,Jelinek对语言学一窍不通,阴差阳错进入IBM语音识别的课题组。当时对语音识别的研发,都是雇一帮语言学家,寄希望于通过他们对语言的知识(比如语法)来开发出能够听懂人话的计算机系统。Jelinek 的背景是计算机学里面一个分支叫做 Information Theory. 他用自己的背景知识来全新的看语音识别的问题。有趣的是,Jelinek和同事在讨论他们这套方法还可以运用在何处的时候,他们觉得一个可能性是股市。股市也有大量的数据,需要建立各种统计模型,而这正是Jelinek研究组所开发出来系统之擅长。Jelinek组里的同事后来果然就加入了华尔街的传奇对冲基金 Renaissance Technologies。这是比较早期的从事语音识别的大师的一些有趣经历。其次,ASR这个领域包含了CS领域很多知识,比如WFST,目前的并行化系统,CUDA编程,以及更时髦的机器学习等等。ASR的很多算法的快速实现都依赖于较好的计算机基础水平。因此,cs来做ASR其实是很合适的。最后,CS来做这个行业,其实就是进入了最火爆的AI领域,对未来的职业发展,目前看应该是不错的。


    推荐阅读