1、账号申请
(1)搜索腾讯云官网
https://cloud.tencent.com/?fromSource=gwzcw.2212127.2212127.2212127&utm_medium=cpd&utm_id=gwzcw.2212127.2212127.2212127
小编:微信和王者荣耀的语音识别还是很强大的,其它的虽然并不清楚
(3)先来看下语音识别的接口文档
1>通过post请求来发送语音数据,从而得到结果
2>请求大小不能超过600k
超过600k不会报错,但是识别时长会有点长
3>音频时长不可超过60s
4>支持音频格式 wav 、mp3
5>比特率128k或者256k
256k比128k保存的数据更具体,对应的文件大小也更大
6>音频流的采样率8000或者16000 (单位时间内有多少数据来描述采样点)
分别对应接口文档的EngSerViceType(引擎类型)的8K或者16k
16000的采样率识别准确率比8000采样率更高
7>请求频率25次/s
使用多线程进行死循环发现,达到25次/s会把请求延迟一点,并不会报错
8>单声道
注:下文小编会介绍怎么把 任意一个音频文件 转换为一个 符合腾讯云识别标准 的音频文件
2、java 实现语音识别
(1)下载SDK
https://cloud.tencent.com/document/product/441/19814
1>打开SDK会发现有两个类 SASRsdk 和 SASRtest 一个wav格式的语音文件