语音识别,让计算机能够把人发出的有意义的语音变成书面语言

语音识别系统是进行数据录入、文字处理、会话处理最为简便的方法。语音识别可实现从语音到文本的转换,即让计算机能够把人发出的有意义的语音变成书面语言。通俗地讲就是让机器能够听懂人说的话。所谓听懂,有两层意思,一是指把用户所说的话逐词逐句转换成文本;二是指正确理解语音中所包含的要求,而不要求所有词都转换正确。

语音识别,让计算机能够把人发出的有意义的语音变成书面语言

语音识别技术(ASR)是以语音为研究对象,涉及生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),目前常见的识别技术一般采用隐马尔可夫模型HMM(Hidden Markov Model)来建模。

语音识别,让计算机能够把人发出的有意义的语音变成书面语言

它的基本原理是系统首先对大量的真实世界中的人的语音进行分析,并建立模型。在识别时,系统同样先对输入的语音进行分析,提取特征,然后通过一定的算法并使用已建立的模型,从而识别出用户所说的话。

语音识别,让计算机能够把人发出的有意义的语音变成书面语言

随着语音识别技术的逐渐成熟,语音识别技术开始得到广泛的应用,涉及日常生活的各个方面如电信、金融、新闻、公共事业等行业,通过采用语音识别技术,可以极大地简化这些领域的业务流程以及操作;提高系统的应用效率。典型的应用就是使用计算机对通过电话输入的语音作出应答,如呼叫转移、电话调查、银行电话付账、股票报价、账户余额查询等。


分享到:


相關文章: