基于ARM的非特定人语音识别系统设计

作者：时间：2014-05-26 来源：网络收藏

本文引用地址：//m.amcfsurvey.com/article/247359.htm

2.3 语音合成单元设计

TTS(Text To Speech)文本转语音技术是人机智能对话发展的趋势。基于TTS技术的语音系统无需事先录音就能够随时根据查询条件查出并合成语音进行播报，从而大大减少了系统维护的工作量。利用此技术，通过MCU或者PC机就能控制语音芯片发音[4].

本文采用SYN6658中文语音合成芯片进行语音合成。SYN6658 通过UART 接口或SPI接口通信方式，接收待合成的文本数据，实现文本到语音(或TTS语音)的转换[6].控制器和SYN6658 语音合成芯片之间通过UART接口连接，控制器通过串口通信向SYN6658语音合成芯片发送控制命令和文本，SYN6658语音合成芯片把接收到的文本合成为语音信号输出，输出的信号经LM386 功率放大器进行放大后连接到喇叭进行播放。如图6所示。

SYN6658语音合成电路采用芯片硬件数据手册提供的典型应用电路进行设计[5],在此不做介绍，功率放大电路采用美国国家半导体生产的音频功率放大器LM386进行放大。

在进行语音合成时首先进行初始化，包括发音人选择、数字处理策略、语速调节、语调调节、音量调节等。

由于该系统要模拟多人发音，所以不同的从设备设置不同的发音人及语调与语速以便于区分。初始化后等待测控计算机的语音合成命令，待收到命令后芯片会向上位机发送1字节的状态回传，上位机可根据这个回传来判断芯片目前的工作状态。语音合成流程图如图7所示。

3 系统软件设计

示教与回放系统的软件设计包括测控计算机的软件设计和各从设备Arduino mega260控制器的软件设计。

测控计算机是整个系统的控制核心，其软件采用C#进行编写，在示教与回放系统中主要是对操作数据的记录以便根据所记录的数据对操作过程进行精确回放，需要记录的数据包括：各从设备操作人员的操作口令，操作动作，口令及动作时间，各操作对应的操作现象。为简化记录数据，事先编制好各事件代码，记录过程只记录代码，大大提高程序效率。建立结构体如下：