开发者社区> 问答> 正文

智能媒体服务文字转语音和视频提取asr都按照30分钟时长的话,分别耗时会是多久?

智能媒体服务文字转语音和视频提取asr都按照30分钟时长的话,分别耗时会是多久?

展开
收起
嘟嘟嘟嘟嘟嘟 2024-05-09 08:38:00 51 0
1 条回答
写回答
取消 提交回答
  • 文字转语音tts,30分钟的音频应该可以10分钟左右合成好
    视频提取字幕asr,速度比较快,30分钟的音频应该可以3分钟左右识别好,具体数据还是需要您这边实际测下为准哈。此回答整理自钉群“【客】智能媒体服务官方答疑群(2)”

    2024-05-09 15:38:31
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载