新闻中心

EEPW首页>消费电子>业界动态> 国内外语音识别行业现状

国内外语音识别行业现状

作者: 时间:2016-08-23 来源:C114 收藏
编者按:随着高速发展之后,智能手机和它所带动的相关产业都陷入了发展瓶颈,机器学习和人工智能被认为是下一个科技热潮,而语音识别也会趁着这个风口飞起来,国内语音行业也可谓是百花齐放,尤其是最近几年,不仅涌现了很多国内外的小公司,而且巨头们也开始加速语音识别行业的布局。

  3、国内外巨头布局的策略差异

本文引用地址://m.amcfsurvey.com/article/201608/295872.htm

  上面历数了国内外各个巨头陆续建立引擎的过程和优势技术,有一点我们还是要特别留意一下:国外巨头欲进入行业,首先想到的就是收购初创的团队,这些团队大都也在5-20人之间,掌握着一定的优势技术。显然收购一家初创团队很难满足其战略发展,因此一旦技术与公司业务融合以后,这些巨头都会频繁出手再次收购以补齐短板,逐渐建立起适合自己公司发展的语音识别优势。

  对于技术相对重要而且技术点又比较分散的科技型公司,国外巨头一般不会采取收购商业模式公司的那种大手笔来收购,这也是导致Nuance最终无人问津的重要因素。想想也是,巨头自然不会用别人家引擎以免将来掣肘,何况收购技术类的大型公司无疑也是给自己找了个麻烦。

  国内的语音识别发展脉路没有那么清晰,刚开始各个巨头也都是采用专用公司比如、中科信利、云知声等公司的引擎。后来醒悟过来,纷纷谋求自建,但是除了百度不断砸入重金后获得了一定的效果外,其他自建的各大公司没有啥实质性进展。这一点从他们试图低薪聘请语音识别相关人才的策略上,也可知道其战略上没什么可发展的。语音识别行业属于声学和计算机的交叉技术,本来培养的人才就很稀缺,而从上述分析可以看出,国内外的技术源头实际上大概集中,无非就是业界相关的研究机构和拥有研发实力的巨头公司。

 4、语音识别行业平衡之下的技术发展趋势

  语音识别行业现在似乎维持着最大的平衡,因为国内外各家的引擎识别率都基本在同一个水平线上,差不多达到了当前语音识别技术的极限,彼此之间差距不是那么明显。本来苹果发布Siri被寄予厚望,这是将语音技术进行大众推广的绝佳良机,但是Siri的表现却与预期相差甚远。即便国内非常火热的微信,其中又有几人使用,甚至知道其中的语音识别技术呢?倒是同样源自声学技术的微信摇一摇功能非常火热。

  这个技术相对语音识别来说,简直就是小巫见大巫,但是应用场景契合的很好。因此,传统的语音识别行业公司都在谋求转型发展,比如Nuance、等,转型失败或者技术储备不足的,或许将来就是最早倒下的,而且这几年也有不少家类似公司倒下了。

  未来的语音识别市场,预计将会有越来越多的公司参与,以后语音识别的性能可能更多的体现在前端技术和语义理解上。机器要与人自然交流,当然就不能重复手机这套语音对话规则,必然就要考虑到用户说话的环境、周围环境的噪音、用户发音不准或者方言等等诸多因素,这就要求前端技术更加精准的模拟人体结构,仿真出机器人听觉系统,以实现解放双手自由对话的目的。

  另外,机器能不能与人自由的交流,不仅需要机器能将语音转换成文字,更需要机器从文字中理解说话人的含义,这一方面是基于大样本的机器学习需要更进一步,另外一方面也需要小样本的自主学习,没有举一反三的功能,似乎语义理解也无法自主适应陌生的环境。这两个新兴的技术领域,或许又会孕育出几家独角兽企业,将真正推动语音从识别走向交互的自然体验,从而向着人工智能再次迈进一步。


上一页 1 2 3 4 5 6 下一页

评论


相关推荐

技术专区

关闭