【ESP32S3 Sense接入语音识别+MiniMax模型对话】

日期：2025-01-02 移动：https://sicmodule.kub2b.com/mobile/quote/18206.html

围绕ESP32S3 Sense接入语音识别+MiniMax模型对话展开，首先串口输入“1”字符，随后麦克风采集2s声音数据，对接百度在线语音识别，将返回文本结果丢入MiniMax模型，进而返回第二次结果文本，实现语言对话文本效果。以上一共有两次调用，后期只需加入tts模块就可完整对话。

讲解视频：

使用Seeed XIAO ESP32S3 Sense开发板接入百度智能云实现在线语音识别。自带麦克风模块用做语音输入，通过串口发送字符“1”来控制数据的采集和上传。

国产大模型接入分享如下：
【ESP32接入国产大模型之MiniMax】
【ESP32接入语言大模型之智谱清言】
【ESP32接入国产大模型之文心一言】
【ESP32接入语言大模型之通义千问】

MM智能助理是一款由MiniMax自研的，没有调用其他产品的接口的大型语言模型。MiniMax是一家中国科技公司，一直致力于进行大模型相关的研究。

模型响应时间内容质量免费token次数地址MiniMax3s8分500万https://www.minimaxi.com/智谱清言7s8分300万https://open.bigmodel.cn/文心一言10s9分500万https://cloud.baidu.com/doc/WENXINWORKSHOP/s/Nlks5zkzu通义千问8s8分800万https://tongyi.aliyun.com/qianwen/

这一次还是采用Arduino编程就会轻松许多开发。这样就可以把stt+chat大模型装进口袋啦🤣🤣🤣，接下来就只差tts播报啦！

在继续此项目之前，请确保检查以下先决条件。

我们将使用 Arduino IDE 对 ESP32/ESP8266 开发板进行编程，因此在继续本教程之前，请确保已在 Arduino IDE 中安装这些开发板。

Arduino IDE：下载并安装 Arduino IDE；
ESP32 开发板库：在 Arduino IDE 中添加 ESP32 支持；
参考博客：【esp32c3配置arduino IDE教程】
为安装过程留出一些时间，具体时间可能因您的互联网连接而异。

要学习本教程，您需要1个 ESP32 开发板+马克风或者ESP32 Sense，建议使用后者，笔者发现同样的代码后者可以轻松调用，ESP32不行（可能板子坏了）。

提供两种硬件测试

ESP32S3 Sense
ESP32 + max9814麦克风模块用做语音输入，一个按键来控制数据的采集和上传

用于实现一个通过 I2S 接口采集音频信号并将其发送到百度语音识别 API 进行语音识别，然后将识别出的文本通过 MiniMax API 获取 AI 回答的功能。以下是代码的主要结构和功能说明：

引入必要的库文件，包括 Arduino.h、base64.h、WiFi.h、HTTPClient.h、cJSON.h、I2S.h 和 ArduinoJson.h，这些库分别提供了基本的 Arduino 功能、base64 编解码、Wi-Fi 连接、HTTP 客户端操作、JSON 数据处理和 I2S 音频接口驱动。
定义了一些全局变量，如 Wi-Fi 的 SSID 和密码，以及与音频采集和处理相关的变量，如 ADC 数据缓冲区、录音标志位、完成标志位、JSON 格式数据缓冲区，还有 MiniMax API 的密钥（apiKey）。

修改Wi-Fi 的 SSID 和密码

修改MiniMax API 的密钥（apiKey）

修改百度api

定义了一个 HTTPClient 实例 http_client，用于向 API 发送请求。
函数 getGPTAnswer() 负责调用 MiniMax API，并传入用户输入文本以获取 AI 的回答。
onTimer() 函数是一个中断服务程序，每当定时器触发时会读取 I2S 接口上的音频数据并存入缓冲区 adc_data 中。当缓冲区满或者录音结束时，会设置完成标志。
setup() 函数负责初始化串口通信、配置 I2S 接口、连接 Wi-Fi，并设置定时器和中断。
loop() 函数是 Arduino 主循环函数，在循环中检查是否有按键输入（这里未实际使用）。如果有特定输入，开始音频采集过程，并在采集完成后将音频数据转换为 base64 编码，构建一个 JSON 请求体，然后通过 HTTP POST 方式发送到百度语音识别 API。收到识别结果后，调用 getGPTAnswer() 函数获取 AI 回答，并打印在控制台上。

ESP32 + max9814麦克风模块用做语音输入，一个按键来控制数据的采集和上传
注意端口：

打开串口监视器，注意右下角选择换行符，选择115200波特率，输入你想问的问题，他就可以回答你

🥳🥳🥳现在，我们在本教程中，您学习了如何使用ESP32S3 Sense接入语音识别+MiniMax模型对话。🛹🛹🛹从而实现对外部世界进行感知，充分认识这个有机与无机的环境，后期会持续分享esp32跑freertos实用案列🥳🥳🥳科学地合理地进行创作和发挥效益，然后为人类社会发展贡献一点微薄之力。🤣🤣🤣

本文地址：https://sicmodule.kub2b.com/quote/18206.html 企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

0 条相关评论

相关最新动态

推荐最新动态

点击排行