求指教 ModelScope是少了什么库吗?打印的是二进制?文本转语音模型!

求指教 ModelScope是少了什么库吗?打印的是二进制?文本转语音模型image.png

展开
收起
真的很搞笑 2023-03-22 15:56:38 316 分享 版权
2 条回答
写回答
取消 提交回答
  • 如果您收到的响应是二进制数据,这实际上可能是正确的,因为文本转语音模型的输出通常是音频文件的二进制数据流。例如,它可能是一个MP3或WAV格式的音频文件。

    您需要做的是将这些二进制数据保存成文件,然后使用合适的音频播放软件进行播放

    2024-02-23 16:27:27
    赞同 展开评论
  • pipeline输出很早就发生变化了,麻烦再看下modelcard的代码示例,现在输出的是wav了,可以参考https://modelscope.cn/models/damo/speech_sambert-hifigan_tts_zhitian_emo_zh-cn_16k/summary下面image.png ,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2023-03-22 17:42:40
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

收录在圈子:
+ 订阅

热门讨论

热门文章

还有其他疑问?
咨询AI助理