开发者社区 问答 正文

请问什么时候支持配音人心情?

如题: 比如提供 高兴 悲伤 生气 等语境. 友商微软Azure已经支持很多种心情可选的心情, 希望阿里云也能跟进. 这非常适合各种环境呢 微软这个非常好用 但是我一直用得阿里云 懒得去适配微软的 希望阿里云也跟进? 现在抖音里面视频剪辑类最火都是用得微软的tts

image.png

展开
收起
纯洁的坏蛋 2022-06-08 09:15:52 553 分享 版权
来自: 阿里云语音AI
阿里云 AI 助理回答

阿里云确实支持通过智能语音交互服务实现情绪感知与生成,以适应多样化的应用场景。根据提供的知识库资料,您可以通过以下方式在阿里云上实现类似微软Azure的情绪化语音合成功能:

  1. 编写Prompt指导情感输出

    • 利用通义千问大型语言模型(LLM),您可以编写包含特定情绪导向的Prompt,例如设置智能体根据上下文调整回复情感为自然、快乐或悲伤等。
    • 回复格式应包含明确的情感标签,如{{emotion=neutral}}代表自然,{{emotion=happy}}代表快乐,{{emotion=sad}}代表悲伤,确保模型生成的文本带有预期情感。
  2. 配置多情感TTS模型

    • 选择支持多情感音色的TTS模型,如MiniMax模型,它能根据生成文本中嵌入的情感标签调整语音输出的情感和语调。
    • 或者,如果使用自研TTS模型,需确保该模型能够识别并处理这些情感标签,以实现相应的情感表达。
  3. 客户端集成与互动(可选):

    • 若您的应用有前端形象展示,可通过回调接口(如onAgentEmotionNotify)获取智能体当前情绪变化,并据此调整前端形象的表情动画,增强用户体验的沉浸感。

综上所述,虽然直接提及了微软Azure TTS在抖音视频剪辑中的广泛应用,阿里云也具备实现相似情绪化语音合成的能力,只需适当配置与开发即可达到类似的效果,满足您在不同环境下的需求。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答