关 闭

新闻中心

EEPW首页>工控自动化>设计应用> 基于Julius的机器人语音识别系统构建

基于Julius的机器人语音识别系统构建

作者: 时间:2011-08-19 来源:网络 收藏

2框架
2.1 硬件结构
的机器狗控制中Atom Z510为训练学习机大脑(1.1 GHz主频的Intel Atom Z510嵌入式控制平台),它主要完成的功能。PXA270控制器(Intel公司于2003年底推出的性能强劲的PXA27x系列嵌入式处理器,ARMv5E的XScale内核,最高频率可达624MHz)作为机器狗本体上的核心智能控制器,接收Atom Z510后的结果,发出控制命令。ATmega128控制器(Atmel公司的8位系列单片机中的一种,运行频率16 MHz)完成串行总线的数字舵机控制,完成对机器狗的前后腿以及尾巴等关节控制。机器狗硬件结构平台如图2所示。

本文引用地址://m.amcfsurvey.com/article/161552.htm

b.jpg


2.2 软件结构
整个包括3个模块:识别模块、GUI人机界面、控制模块。将识别的语音命令提交给GUI模块,并在GUI上显示;同时GUI将语音命令转化为动作控制命令并发给控制模块;GUI还可以控制的启动和停止。其中机器人控制模块主要在PXA270上,而语音识别和GUI是在Atom Z510上。系统软件模型如图3所示。

c.jpg



3 语音识别系统
一个完整的语音识别系统一般包括3部分:声学模型、语言模型和识别器。在本系统中只建立控制命令(动词)的识别语法,其他词忽略,因此没有语言模型;识别器采用Julius开源平台,此部分只用配置参数和相关文件。本文主要工作是声学模型训练和语音识别系统
3.1 声学模型训练
声学模型是识别系统的底层模型,是语音识别系统中最关键的一部分,它是每个声学单元的声学模型参数集合。本系统的声学模型是使用HTK对采集的语音库进行多次迭代训练后提取的,基于词的声学特征向量集。HTK(HMM Tools Kit)是由英国剑桥大学工程系的语音视觉和机器人技术工作组(Speech Vision and Robotics Group)开发,专门用于建立和处理HMM的实验工具包,主要应用于语音识别领域,也可用于语音模型的测试和分析。其具体训练步骤如下:
(1)数据准备
收集汉语标准普通话的语料库,并将语料库中的语音标记,创建语音识别单元元素列表文件。
(2)特征提取
本系统采用MFCC进行语音的特征参数提取,训练中将每一个语音文件用工具HCopy转换成MFCC格式。
(3)HMM定义
在训练HMM模型时要给出模型的初始框架,本系统中的HMM模型选择同一个结构,如图4所示。该模型包含4个活动状态{S2,S3,S4,S5),开始和结束(这里是S1.S6),是非发散状态。观察函数bi是带对角矩阵的高斯分布,状态的可能转换由aij表示。



评论


相关推荐

技术专区

关闭