开发者社区 问答 正文

智能媒体服务设置文字转语音的音量的时候,如果设置成1,那么这个音量值的参考是 视频里的原声么?

在智能媒体服务中设置文字转语音的音量时,若将音量设为1,该音量值是参照视频原有声音还是某个音轨?具体场景涉及job id为fb341679e7154d32a42e08a728491c84的任务,合成出的字幕语音音量与背景音乐音量差不多,背景音乐音量设定为0.34。

展开
收起
三分钟热度的鱼 2024-01-17 20:38:21 83 分享 版权
来自: 阿里云视频云
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    您好,当您在使用智能媒体服务设置文字转语音的音量为1时,这个音量值实际上是相对于视频里的原声而言的。这意味着如果您将音量设定为1,则生成的文字转语音的音量将会和视频中原声的音量保持一致。此外,值得注意的是,除了音量以外,您还可以自由设定其他诸如背景音量、语速、语调等参数,以实现更加符合您需求的文字转语音效果。

    2024-01-18 17:01:57
    赞同 展开评论
  • 这个是相对音频合成本身的
    https://help.aliyun.com/document_detail/449563.html?spm=a2c4g.2557679.0.0.2843709dIQhNsa

    目前没有参考其他轨道 。此回答整理自钉群“【客】智能媒体服务官方答疑群(2)”

    2024-01-17 20:48:08
    赞同 展开评论