【ESP32S3 Sense接入语音识别+MiniMax模型对话】

【ESP32S3 Sense接入语音识别+MiniMax模型对话】

2025-01-02 22:31

围绕ESP32S3 Sense接入语音识别+MiniMax模型对话展开，首先串口输入“1”字符，随后麦克风采集2s声音数据，对接百度在线语音识别，将返回文本结果丢入MiniMax模型，进而返回第二次结果文本，实现语言对话文本效果。以上一共有两次调用，后期只需加入tts模块就可完整对话。

讲解视频：

使用Seeed XIAO ESP32S3 Sense开发板接入百度智能云实现在线语音识别。自带麦克风模块用做语音输入，通过串口发送字符“1”来控制数据的采集和上传。

国产大模型接入分享如下：
【ESP32接入国产大模型之MiniMax】
【ESP32接入语言大模型之智谱清言】
【ESP32接入国产大模型之文心一言】
【ESP32接入语言大模型之通义千问】

MM智能助理是一款由MiniMax自研的，没有调用其他产品的接口的大型语言模型。MiniMax是一家中国科技公司，一直致力于进行大模型相关的研究。

模型响应时间内容质量免费token次数地址MiniMax3s8分500万https://www.minimaxi.com/智谱清言7s8分300万https://open.bigmodel.cn/文心一言10s9分500万https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Nlks5zkzu通义千问8s8分800万https://tongyi.aliyun.com/qianwen/

这一次还是采用Arduino编程就会轻松许多开发。这样就可以把stt+chat大模型装进口袋啦🤣🤣🤣，接下来就只差tts播报啦！

在继续此项目之前，请确保检查以下先决条件。

我们将使用 Arduino IDE 对 ESP32/ESP8266 开发板进行编程，因此在继续本教程之前，请确保已在 Arduino IDE 中安装这些开发板。

Arduino IDE：下载并安装 Arduino IDE；
ESP32 开发板库：在 Arduino IDE 中添加 ESP32 支持；
参考博客：【esp32c3配置arduino IDE教程】
为安装过程留出一些时间，具体时间可能因您的互联网连接而异。

要学习本教程，您需要1个 ESP32 开发板+马克风或者ESP32 Sense，建议使用后者，笔者发现同样的代码后者可以轻松调用，ESP32不行（可能板子坏了）。

提供两种硬件测试

ESP32S3 Sense
ESP32 + max9814麦克风模块用做语音输入，一个按键来控制数据的采集和上传

用于实现一个通过 I2S 接口采集音频信号并将其发送到百度语音识别 API 进行语音识别，然后将识别出的文本通过 MiniMax API 获取 AI 回答的功能。以下是代码的主要结构和功能说明：

引入必要的库文件，包括 Arduino.h、base64.h、WiFi.h、HTTPClient.h、cJSON.h、I2S.h 和 ArduinoJson.h，这些库分别提供了基本的 Arduino 功能、base64 编解码、Wi-Fi 连接、HTTP 客户端操作、JSON 数据处理和 I2S 音频接口驱动。
定义了一些全局变量，如 Wi-Fi 的 SSID 和密码，以及与音频采集和处理相关的变量，如 ADC 数据缓冲区、录音标志位、完成标志位、JSON 格式数据缓冲区，还有 MiniMax API 的密钥（apiKey）。

修改Wi-Fi 的 SSID 和密码

修改MiniMax API 的密钥（apiKey）

修改百度api

定义了一个 HTTPClient 实例 http_client，用于向 API 发送请求。
函数 getGPTAnswer() 负责调用 MiniMax API，并传入用户输入文本以获取 AI 的回答。
onTimer() 函数是一个中断服务程序，每当定时器触发时会读取 I2S 接口上的音频数据并存入缓冲区 adc_data 中。当缓冲区满或者录音结束时，会设置完成标志。
setup() 函数负责初始化串口通信、配置 I2S 接口、连接 Wi-Fi，并设置定时器和中断。
loop() 函数是 Arduino 主循环函数，在循环中检查是否有按键输入（这里未实际使用）。如果有特定输入，开始音频采集过程，并在采集完成后将音频数据转换为 base64 编码，构建一个 JSON 请求体，然后通过 HTTP POST 方式发送到百度语音识别 API。收到识别结果后，调用 getGPTAnswer() 函数获取 AI 回答，并打印在控制台上。

ESP32 + max9814麦克风模块用做语音输入，一个按键来控制数据的采集和上传
注意端口：

打开串口监视器，注意右下角选择换行符，选择115200波特率，输入你想问的问题，他就可以回答你

🥳🥳🥳现在，我们在本教程中，您学习了如何使用ESP32S3 Sense接入语音识别+MiniMax模型对话。🛹🛹🛹从而实现对外部世界进行感知，充分认识这个有机与无机的环境，后期会持续分享esp32跑freertos实用案列🥳🥳🥳科学地合理地进行创作和发挥效益，然后为人类社会发展贡献一点微薄之力。🤣🤣🤣

以上就是本篇文章【【ESP32S3 Sense接入语音识别+MiniMax模型对话】】的全部内容了，欢迎阅览！文章地址：https://sicmodule.kub2b.com/quote/18206.html
栏目首页相关文章动态同类文章热门文章网站地图返回首页企库往资讯移动站https://sicmodule.kub2b.com/mobile/,查看更多