智能媒体服务能根据jobId查到这个任务的入参?这边默认会传VOD_NO_TRANSCODE的。SubmitASRJob接口有没有办法让结果的每段字幕分布均匀一点?有时候前面一句不到5个字,后面一句40多个字,有没有参数能设置?
阿里云智能媒体服务可以通过jobId查询到该任务的入参。在SubmitASRJob接口中,可以通过设置参数来让结果的每段字幕分布均匀一些。具体来说,可以使用以下参数:
subtitle_mode
:用于指定字幕模式,可选值为VOD_NO_TRANSCODE
和VOD_TRANSCODE
。如果设置为VOD_TRANSCODE
,则会根据视频时长自动调整字幕长度,使每段字幕的长度相对均匀。
subtitle_layout
:用于指定字幕布局方式,可选值为AUTO
和CUSTOM
。如果设置为CUSTOM
,则可以自定义字幕布局方式,例如通过设置每个时间段的字数上限来控制字幕长度。
subtitle_max_words
:用于指定每个时间段的最大字数限制。如果设置了该参数,则系统会尽量将字幕控制在该字数范围内,以实现每段字幕长度相对均匀的效果。
需要注意的是,以上参数仅适用于VOD_TRANSCODE
模式下的字幕生成。如果使用VOD_NO_TRANSCODE
模式,则无法通过这些参数来控制字幕长度。
智能媒体服务的SubmitASRJob接口确实可以根据jobId查找任务的入参。对于字幕分布不均的问题,目前SubmitASRJob接口并未提供直接的参数来控制每段字幕的字数。然而,你可以尝试通过调整视频的播放速度或者修改字幕的显示时长来改善这个问题。例如,对于前面一句不到5个字,后面一句40多个字的情况,你可以尝试将后面的字幕分割成几个较短的字幕,以使得每个字幕的长度更加均匀。
您有预期分句的设计的话,可以通过ssml标签做配音。此回答整理自钉群“【客】智能媒体服务官方答疑(群满请加2群48335001108)”。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。