智能手机的超性能语音识别技术

作者：时间：2011-03-30 来源：网络收藏

未来的方向

本文引用地址：//m.amcfsurvey.com/article/166191.htm

　　询问参加开发语音技术的每一个人下一个巨大的步骤是什么。他们一般会给你一个答案：自然语言处理。

　　Revis把它解释为理解你的意思的系统，它不仅仅知道你说什么。在会话式的互动模式中，用户说自己要说的话，没有限制用户如何说这个话。他提供了指令或者要求得到信息的例子，如“我在什么地方能够买到100美元以下的尼康照相机?”或者“给杰尼发个短信说我晚到20分钟”或者“今天晚上在Morton's订三个人的地方”。

　　谷歌的Mane称，在口语对话中提供自然的语言处理是一个双重挑战。首先，你必须识别这些单词，然后，你必须理解这个意思。第一部分变得更加容易了。但是，第二部分仍然很难解决：意思是根据上下文确定的和难以应付的，人类做的语法分析也不是总是成功的。

　　微软的Rele认为，手机提供的额外的服务(如罗盘或者GPS)能够增强自然语言处理的有用性。他说，你可以为两个人安排吃饭和看电影，方法是利用不同来源的数据把这个任务分开，如使用日历、饭店排名、电影评论和位置等数据。

　　此外，手机的服务能够用于提供讲话的环境。Rele表示，用户的语音输入以及从其它有关用户及用户环境的传感器和状态获得的智能信息可以提供更丰富的和更相关的结果。例如，如果你刚刚使用Foursquare网站查看有关饭店，一些含糊的语音指令就会倾向于外出吃饭、订膳宿和要一辆出租车等事情。

　　多平台应用程序Vlingo自称是“虚拟助手”，已经能够提供这些方面的功能。这个软件插入到OpenTable和Fandango等服务中以完成许多任务：订饭店、订电影票等等。

　　Nguyen认为未来语音识别技术改善的另一个领域是游戏。他说，在游戏中可以使用语音以增加玩游戏的不同氛围。例如，你可以把Kirk-style船长的命令传递给恒星飞船或者在在一个神秘的事情中审讯疑犯。

　　是你吗?

　　已经应用的另一个功能是自动地把语音识别适用于单个用户。这是台式电脑语音识别技术所要求的免提版语音训练。

　　例如，最新版本的谷歌语音搜索有一个选择性加入功能，允许随着时间的推移建立一个用户的客户化语音特征。Mane解释说，当用户选择使用客户化语音识别的时候，我们在用户和用户的语调方面画一个界限，这使我们能够建立一个初步的、个性化的语音识别模式。

　　然而，个性化识别并不是一个能够解决一切问题的技术，它只是实现语音识别更加无缝化的一个过渡步骤。Mane称，我们没有把个性化识别看作一个唯一的解决方案，因为还会有更多的一系列的技术创新。Mane认为，这种技术未来的改进需要我们的用户更积极的参与。

　　结论

手机一直是许多技术的孵化器和推动因素，这包括硬件和软件技术。到目前为止，在这个组合中增加语音功能仅产生了逐步的改善，谷歌语音应用程序的很好的功能。

　　但是，这些改进正逐步地为更重要的进步铺平道路。移动技术为如何聚集这些新技术提供了一个全新的舞台。下一步也许不是一个理解你说的一切事情的手机，而是能够充分理解你说的事情的一个更有用的手机。

新闻中心

智能手机的超性能语音识别技术

评论

相关推荐

技术专区