基于Julius的机器人语音识别系统构建

作者：时间：2011-08-19 来源：网络收藏

2系统框架
2．1 硬件结构
在语音识别的机器狗控制系统中Atom Z510为训练学习机大脑(1．1 GHz主频的Intel Atom Z510嵌入式控制平台)，它主要完成语音识别的功能。PXA270控制器(Intel公司于2003年底推出的性能强劲的PXA27x系列嵌入式处理器，基于ARMv5E的XScale内核，最高频率可达624MHz)作为机器狗本体上的核心智能控制器，接收Atom Z510识别后的结果，发出控制命令。ATmega128控制器(Atmel公司的8位系列单片机中的一种，运行频率16 MHz)完成基于串行总线的数字舵机控制，完成对机器狗的前后腿以及尾巴等关节控制。机器狗硬件结构平台如图2所示。

本文引用地址：//m.amcfsurvey.com/article/161552.htm

2．2 软件结构
整个机器人系统包括3个模块：Julius语音识别模块、GUI人机界面、机器人控制模块。Julius将识别的语音命令提交给GUI模块，并在GUI上显示；同时GUI将语音命令转化为动作控制命令并发给机器人控制模块；GUI还可以控制Julius的启动和停止。其中机器人控制模块主要在PXA270上，而语音识别和GUI是在Atom Z510上。系统软件模型如图3所示。

3 语音识别系统构建
一个完整的语音识别系统一般包括3部分：声学模型、语言模型和识别器。在本系统中只建立基于控制命令(动词)的识别语法，其他词忽略，因此没有构建语言模型；识别器采用Julius开源平台，此部分只用配置参数和相关文件。本文主要工作是声学模型训练和语音识别系统构建。
3．1 声学模型训练
声学模型是识别系统的底层模型，是语音识别系统中最关键的一部分，它是每个声学单元的声学模型参数集合。本系统的声学模型是使用HTK对采集的语音库进行多次迭代训练后提取的，基于词的声学特征向量集。HTK(HMM Tools Kit)是由英国剑桥大学工程系的语音视觉和机器人技术工作组(Speech Vision and Robotics Group)开发，专门用于建立和处理HMM的实验工具包，主要应用于语音识别领域，也可用于语音模型的测试和分析。其具体训练步骤如下：
(1)数据准备
收集汉语标准普通话的语料库，并将语料库中的语音标记，创建语音识别单元元素列表文件。
(2)特征提取
本系统采用MFCC进行语音的特征参数提取，训练中将每一个语音文件用工具HCopy转换成MFCC格式。
(3)HMM定义
在训练HMM模型时要给出模型的初始框架，本系统中的HMM模型选择同一个结构，如图4所示。该模型包含4个活动状态{S2，S3，S4，S5)，开始和结束(这里是S1．S6)，是非发散状态。观察函数bi是带对角矩阵的高斯分布，状态的可能转换由aij表示。

新闻中心

基于Julius的机器人语音识别系统构建

评论

相关推荐

技术专区