开发者社区> 问答> 正文

智能媒体服务设置文字转语音的音量的时候,如果设置成1,那么这个音量值的参考是 视频里的原声么?

在智能媒体服务中设置文字转语音的音量时,若将音量设为1,该音量值是参照视频原有声音还是某个音轨?具体场景涉及job id为fb341679e7154d32a42e08a728491c84的任务,合成出的字幕语音音量与背景音乐音量差不多,背景音乐音量设定为0.34。

展开
收起
三分钟热度的鱼 2024-01-17 20:38:21 54 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    您好,当您在使用智能媒体服务设置文字转语音的音量为1时,这个音量值实际上是相对于视频里的原声而言的。这意味着如果您将音量设定为1,则生成的文字转语音的音量将会和视频中原声的音量保持一致。此外,值得注意的是,除了音量以外,您还可以自由设定其他诸如背景音量、语速、语调等参数,以实现更加符合您需求的文字转语音效果。

    2024-01-18 17:01:57
    赞同 展开评论 打赏
  • 这个是相对音频合成本身的
    https://help.aliyun.com/document_detail/449563.html?spm=a2c4g.2557679.0.0.2843709dIQhNsa

    目前没有参考其他轨道 。此回答整理自钉群“【客】智能媒体服务官方答疑群(2)”

    2024-01-17 20:48:08
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载