文档备案控制台

开发者社区问答正文

如何使用Python调用阿里云的实时语音识别API？

如何使用Python调用阿里云的实时语音识别API？

展开

收起

邂逅青青 2024-08-05 19:18:04 638 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

君子世无双~
首先需要安装pyaudio第三库

然后获取您的阿里云DashScope API密钥，并在代码中设置

导包：
import pyaudio
from dashscope.audio.asr import Recognition, RecognitionCallback, RecognitionResult

设密钥：
dashscope.api_key = 'YOUR-DASHSCOPE-API-KEY' # 使用您的API密钥替换此处

回调类：
```
class Callback(RecognitionCallback):
    def on_open(self) -> None:
        global mic, stream
        print('RecognitionCallback open.')
        mic = pyaudio.PyAudio()
        stream = mic.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True)

    def on_close(self) -> None:
        global mic, stream
        print('RecognitionCallback close.')
        stream.stop_stream()
        stream.close()
        mic.terminate()
        stream = None
        mic = None

    def on_event(self, result: RecognitionResult) -> None:
        print('RecognitionCallback sentence: ', result.get_sentence())
```
然后说初始化：callback = Callback()
recognition = Recognition(model='paraformer-realtime-v2', format='pcm', sample_rate=16000, callback=callback)
recognition.start()

while True:
if stream:
data = stream.read(3200, exception_on_overflow=False)
recognition.send_audio_frame(data)
else:
break

recognition.stop()
[

参考文档](https://help.aliyun.com/zh/model-studio/user-guide/automatic-speech-recognition?spm=a2c6h.13066369.0.0.79e26397cErhJo&scm=20140722.S_help@@%E6%96%87%E6%A1%A3@@2842554@@10.S_llmOS0.ID_2438296-RL_Python%E8%B0%83%E7%94%A8%E9%98%BF%E9%87%8C%E4%BA%91%E5%AE%9E%E6%97%B6%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%ABAPI-LOC_chat~DAS~llm-OR_ser-V_3-P0_0)
2024-08-31 18:24:28

赞同展开评论

问答分类：

Python 语音技术 API 智能语音交互智能语音交互

问答标签：

Python api 阿里云API 阿里云智能语音交互语音识别API Python阿里云

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

阿里云的语音交互服务，免费试用期是多久？

894

1

0

做跨境电商，采集数据用python自己写还是用亮数据API？

304

2

0

阿里云语音识别服务有哪些

193

0

0

我使用了语音合成CosyVoice大模型的api，并且使用了文档上面贴图的python sdk,报错

393

0

0

python提示没有dingtalk.api

562

0

0

想使用python 调用 openai sdk来使用qwen的api, 应该使用哪一个平台?

2292

1

0

如何使用PHP实现与阿里云WebSocket实时语音识别？

532

1

0

阿里语音AI实时语音识别 sdm 有个产品功能诉求：目前了解到没有API可以查询到即时占用的chan

1105

0

0

阿里云语音AI智能语音交互中录音文件识别的customization_id定制模型还是不能区分热词。

255

1

0

如何通过Python脚本请求ACK容器服务的API列表并忽略SSL证书验证？

351

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

Qoder Work是个好家伙，但是什么时候能支持自定义模型API？

idea qoder cn报错

相关文章

最新版通义千问（Qwen3.7-Plus）功能介绍

最新版阿里云千问大模型（Qwen）功能介绍

银行运营自动化：7大场景的AI Skill落地实战

金融AI技能库：104个开源Skill即插即用

万相Wan2.1-VACE-Plus 视频编辑模型详解：收费标准、限流规则、同步调用 Demo

还有其他疑问?