1. 离线语音识别及合成模块
1.1. 简介
语音处理技术是下一代多模式交互的人机界面设计中的核心技术之一。随着消费类电子产品中对于高性能和稳健性的语音接口需求的快速增加,嵌入式语音处理技术快速发展。根据市场对嵌入式语音识别系统的需求,我们推出了“离线词条匹配式”语音识别方案。
模块采用GD32 核心,搭配自主设计的软固件实现了语音识别ASR 功能+语音合成TTS 功能,用户只需在上位机中改写词条并烧录到模块,然后通过识别和合成功能就可以实现简单的语音对话。
特点:
- 同时具有语音识别与合成功能
- 识别词条可以根据需求随意设置
- 离线工作无需连接网络
1.2. 性能参数
工作电压:5V
电流:依据扬声器功率而定,在驱动4R 3W 的扬声器至少需要1A供电
1.3. 接口
MircroUSB
用于下载程序
XH2.54-2P
连接扬声器
2x5P 2.54mm排针
供电及通讯接口
1.4. 兼容性
模块同时兼容 Arduino 与 Micro:bit 平台。
- MakerPro3
- MakeCode
1.5. 外观及引脚功能说明
模块体积小巧,长宽分别为:4.5*3.3cm。模块板载高灵敏度驻极体,自带USB 转TTL 串口电路(板载CH340E),自带驻极体音频放大电路,下载动作和通信需求有专门的拨动开关可以切换(拨动到DOWN 可进行下载,实现电脑上位机词条的烧录,拨动到UART 可进行通信,此时可以外接单片机到T和R 引针进行控制),板载D 类3W 音频功放芯片,可以实现TTS 语音合成信号的放大,直接推动8W 0.5W 或者4R 3W 的扬声器发声(此时需要确保5V 供电支持电流在1A 以上),板载复位按键用于复位主处理器,信号指示灯与电源指示灯,模块具体结构见下图说明。
模块共引出2*5 个引针,这些引针的定义和功能如下:
引脚名称 | 引脚功能 |
---|---|
5* | 5V 电压输入/输出引脚 |
3 | 3.3V 电压输出引脚(来自于板载LDO 稳压芯片,可输出200mA) |
G* | 系统电源地 |
L | 保留引脚,可悬空 |
S | TTS 语音合成,原始音频信号输出 |
T* | 串行数据发送引脚,通常情况下应与计算机或者单片机的TTL 串口串行数据接收引脚相连接,即RXD |
R* | 串行数据接收引脚,通常情况下应与计算机或者单片机的TTL 串口串行数据接发送脚相连接,即TXD |
标注 * 号的引脚为一般正常使用是连接的引脚。
注意:模块的3.3V电源引脚是输出引脚,不可用于对模块供电。
1.6. 使用教程
-
模块的语音合成功能可以实时合成,但语音识别功能需要预先使用配置软件设定识别的词条,所以在编程软件中使用模块前,请按照此说明设置语音识别的词条。