开发者社区> 问答> 正文

请问阿里语音AI的ASR支持字级别的时间戳返回嘛?

问题一:请问阿里语音AI的ASR支持字级别的时间戳返回嘛?
录音文件识别
问题二:没有更细的粒度了嘛?

展开
收起
乐天香橙派 2023-07-18 15:17:49 307 0
4 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    问题一:阿里语音AI的ASR服务支持返回字级别的时间戳。在使用阿里语音AI的ASR服务时,可以通过设置相应的参数,获取识别结果中每个字的文本内容以及开始和结束时间戳。具体的参数设置和返回结果格式可以参考阿里语音AI的官方文档。

    问题二:除了字级别的时间戳,阿里语音AI的ASR服务还支持更细的粒度。在使用阿里语音AI的ASR服务时,可以根据需要设置不同的时间戳粒度,例如音节级别、词级别、句子级别等。

    2023-07-28 22:56:53
    赞同 展开评论 打赏
  • 云端行者觅知音, 技术前沿我独行。 前言探索无边界, 阿里风光引我情。

    问题一:阿里语音AI的ASR(Automatic Speech Recognition)服务通常可以返回识别结果的时间戳信息,但具体是否支持字级别的时间戳返回,可能需要查阅阿里云的文档或与阿里云的技术支持团队联系以获取准确的信息。

    问题二:如果您指的是更细的时间戳粒度,例如音频中每个字的具体开始和结束时间,这可能取决于具体的ASR服务和配置。一些ASR服务可能提供更细粒度的时间戳信息,而另一些可能只提供更粗略的时间戳,例如句子级别或词级别。

    2023-07-21 22:45:18
    赞同 展开评论 打赏
  • 是的,阿里语音AI的ASR(自动语音识别)服务支持字级别的时间戳返回。

    通过使用阿里云的ASR服务,您可以将音频转换为文字,并获取每个识别结果的起始时间和结束时间。这些时间戳可以以秒为单位(浮点数)进行表示,并与每个识别结果中的字级别文本对应。

    在调用ASR服务时,您可以设置相应的参数来指定是否返回字级别的时间戳信息。例如,在使用阿里云的Python SDK时,可以通过以下示例代码来获取字级别时间戳:

    from aliyun_tts.client import AliyunASRClient
    
    client = AliyunASRClient(app_key='your_app_key', app_secret='your_app_secret')
    result = client.asr(audio_data, format='pcm', sample_rate=16000, enable_timestamp=True)
    

    在上述代码中,enable_timestamp 参数设置为 True,表示启用字级别时间戳的返回。

    2023-07-18 18:05:53
    赞同 展开评论 打赏
  • 针对问题一的回答:是词级别
    针对问题二的回答:识别确实目前没有—此回答来自钉群“阿里语音AI【6群】”

    2023-07-18 17:09:49
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
2023云栖大会:PolarDB for AI 立即下载
2023云栖大会:Lindorm一站式AI数据平台实战 立即下载
释放算力潜能加速应用构建Serverless为AI创新提速 立即下载