当前位置:人教网2010>>信息技术>>学生天地>>课外阅读

最近一个新的词汇语音识别渐渐热了起来,并不断见诸报端,虽然语音识别技术还处在非常幼稚的年代,但它却是计算机技术重要的未来方向,简单地说,这一技术就是让电脑听懂人的话,并作出正确反应,这是电脑在拟人化上迈出的一大步,它已经从各个方向来到了我们的生活中。

目前关于语音识别的研究以及应用重点主要集中以下几个方面:

1.语音控制(Voice-Command):即用人声控制机器的动作。目前单独支持中文或英文的语音控制环境已经比较成熟,市场上的各产品都能较好地实现,但同时支持中文和英文语音控制的产品并不多见,而目前中国众多电脑使用者大多同时使用中英文软件。

2.电子发声(Voice-Text):即让电脑念文章,这是人与电脑沟通的一个重要方面,英文电子声研究成果很多,中文还处于起步状况.但此类软件还未有实质性突破,主要问题在于电子味道较浓。单词的电子发音相对较好,但连续语音方面效果较差,而且大多设置复杂,无法直接使用。不过如果将其使用在娱乐休闲等产品上,将给人特别的感觉。

3.连续语音识别(ContinualSpeech):中英文连续语音识别技术都已进入使用阶段,IBMVIAVOICE是典型产品,但同样存在无法实现中英文混合识别问题。连续语音识别目前主要的识别目前主要问题集中在:

1)在非标准音的用户需要较长的学习适应过程。

2)对于中文由于使用隐马尔科夫算法,对多音字的识别有了很大进展,但依旧存在对多音字识别的问题,目前主要的识别错误基本都来自此类问题。

4.非连续语音识别(WordRecognize):对有限词的识别技术相对较完善,但大词汇量非特定人等方面识别效果很差。尤其是对其中爆破音,后鼻音的识别十分困难。

5.语音学习(Training):这是语音识别的一个较新方向,它的侧重点与传统的语音识别不同,通常意义的语音识别是通过电脑适应人的发音来识别人的说话,而它则要求人模仿标准发音,其面临的困难是如何衡量人模仿的好坏。金洪恩公司的《随心所欲说英语》就是采用“语音学习”的技术制作的,并收到了良好的效果。

此外,目前所有的语音识别系统在有较大背景京噪声下的识别率都会显著降低,这无疑是一个重大的课题。

    
【上一篇】
【下一篇】