modelscope-funasr之前实时语音转写都可以正常输出文本，测试一直卡在这一步，啥原因？

modelscope-funasr之前实时语音转写都可以正常输出文本，刚才测试一直卡在这一步，了解是什么原因吗？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-05-09 08:40:35 407 版权

阿里云 AI 助理回答

根据您描述的问题，modelscope-funasr 的实时语音转写功能之前可以正常输出文本，但最近测试时一直卡在某一步。以下是可能的原因分析及解决方法：

实时语音转写依赖于音频流的正确输入。如果音频输入中断或异常，可能会导致转写卡住。

排查步骤：
- 确认音频采集设备（如麦克风）是否正常工作。
- 检查音频数据回调函数是否正确填充了录音数据。例如，在 Android SDK 中，audioRecord.read(buffer, 0, len) 是否返回正确的数据长度。
- 如果使用的是自定义音频源，请确保音频格式符合要求（如 PCM 编码、16kHz 采样率、单声道）。
解决方案：
- 使用工具（如 Audacity 或 FFmpeg）验证音频文件的格式和采样率是否正确。
- 如果音频输入中断，建议增加重试机制以应对网络波动或设备异常。

实时语音转写需要稳定的网络连接。如果网络中断或延迟过高，可能导致服务无法正常响应。

排查步骤：
- 检查当前网络是否稳定，是否存在断网或高延迟的情况。
- 如果网络中断后重新连接，确认 SDK 是否需要手动重新初始化。例如，Android SDK 在断网后不会自动重连，需开发者实现重试逻辑。
解决方案：
- 增加重连机制，确保在网络恢复后重新调用 nui_dialog_start 接口启动识别。
- 检查 SSL 连接是否正常，避免因证书问题导致连接失败（错误码 240063 和 240064）。

SDK 初始化失败或参数配置错误可能导致转写功能异常。

排查步骤：
- 确认 nui_initialize 接口是否成功初始化。如果初始化失败，检查日志中是否有相关错误信息。
- 验证参数配置是否正确。例如，sr_format 参数应设置为小写（如 "pcm"），且采样率与模型选择一致。
解决方案：
- 确保初始化代码中正确设置了 Appkey 和 Token。
- 检查是否完成 SDK 配置文件的拷贝。例如，CommonUtils.copyAssetsData(this) 是否成功执行。

如果客户端配置无误，可能是服务端出现了问题。

排查步骤：
- 检查服务端是否返回错误码（如 240062）。如果是服务端错误，需进一步定位原因。
- 确认服务 URL 是否正确，DNS 解析是否正常（错误码 240066）。
解决方案：
- 联系阿里云技术支持，提供详细的日志信息以便排查服务端问题。
- 确保服务端版本与客户端 SDK 版本兼容。