神器 | 文本转语音,直接可以合成多人多风格音频了!

简介: 为了适应更多的音频使用场景和需求,近期我们将文本转语音服务进行了升级,全新的功能将成为你配音工具的不二之选。

为了适应更多的音频使用场景和需求,近期我们将文本转语音服务进行了升级,全新的功能将成为你配音工具的不二之选。


“善变”的笑笑


现在,笑笑的语音风格更多了,目前已有:正式叙述,热情友好,热情轻松,轻松随意,沉着冷静,欢快高音,哭泣呜咽,生气愤怒,紧张不安,不悦轻蔑,严肃命令,温暖亲切(高音),温和礼貌(低音),优美伤感


有没有被这庞大的语音风格群体所吓到呢?用简单的话来说——笑笑几乎能发出我们日常能接触到的所有语音风格。


有了这些说话风格,我们就能随心所欲地合成各种类型的音频了,包括且不限于:新闻播报自媒体配音微课配音故事阅读虚拟主播


相信,在你的手上,还能玩出更多新花样。


新的播讲人——云叶


这是一位专业讲故事的机器人,但它讲故事的风格可能和你印象中的故事有点区别,它使用的是说书人的说话风格,可以试听下面的音频。具体用不用得上,就自己决定喽。


多播讲人多风格合成


或许,我们的文本转语音工具是目前能实现此需求的最简单的。只需要把文本输入进去,给不同的文本选择不同的发言风格,就能生成一部广播剧!


什么叫多播讲人多风格?


曾经,我们想在一个音频中实现多个机器人发音或者同一个机器人不同语音,正常的操作应该是:分成段多次合成,再用音频剪辑工具把多段音频合成


而如今,有了我们的文本转语音工具,你只需要合成一次,就能把不把播讲人及不同风格的发音合成到一个音频中



如何实现多播讲人多风格?


新版的界面,已经把播讲人和风格放置在了文本框的前面,表示这一行将使用前面所选定的播讲人和风格。


细心的你,一定能找到增加一行这个按钮,点一下,就能在原来的基础上增加一行,在这一行中,你能单独设置播讲人和风格。


那么综合利用起来,你就能制作如下图所示的音频内容,图片后有音频可以试听。



免费体验


说得好听,不如上手体验。


新版增加这么多功能,还是给了大家免费体验的机会,每个微信账号每天能够免费使用本工具9次(每个体验码能体验合成3次,每个微信号每天最多能获得3个体验码)。


免费体验可以使用上面所述的所有功能,与付费使用完全相同。唯一有限制的是:免费体验每次最大字数不能超过500字(后期可能还会再调小)


付费使用


为了大家能够更长久地使用本工具,我们还是制作了付费功能,相比市面上其他语音合成工具,相信已经便宜得令人发指了。


基本情况


付费标准是:每100个字收费0.1元,不足100按100计数。


付费合成文字最大长度:2000。


换句话说,付费合成每次最少支付0.10元,最多支付2.00元。


(可能后期资费标准会变更,请注意界面中的提示。)


如何付费?


可能你在页面上没有找到“付费”的相关按钮,其实很简单,只要不填写体验码,点击“合成”按钮后,自动进入费用核算环节,直到微信扫码支付,才能合成音频。


特别提示


扫码支付后,才真正开始合成音频,所以可能有一段等待的时间,请务必耐心等待,切不可关闭网页。


修饰符号


为了保证音频的正确性,我们还是保留了[b][s]标签,用来进行人工干预停顿和多音字。


人工停顿


只需要在文字中插入[b],就能在该处停顿100毫秒,如果想停顿其他时长,则插入[b 停顿毫秒数]


多音字


我们使用[s]标签来控制多音字,具体的格式是:[s 字 拼音 声调],比如:银[s 行 hang 2],机器人就能发出“银行”的读音。


最大化利用


目前,使用本工具的最佳方式是:免费体验+付费相结合。


将容易读错、断句易错的文字,用免费体验的方式打上[b][s]标签试听,满意后再整合长文本,使用付费的方式一次性合成音频。


多使用本工具几次后,相信你也能做到和我一样:拿到文字,就知道该在哪些地方打上[b][s]标签。




不管现在用不用得上,建议收藏本文章,以免急需时找不到。


再见!



不坑


谢谢你的支持!

相关文章
|
7月前
|
人工智能 自然语言处理 数据可视化
比Sora更王炸,LTX Studio文本生成超25秒,视频自带背景音乐、转场等效果!
【2月更文挑战第13天】比Sora更王炸,LTX Studio文本生成超25秒,视频自带背景音乐、转场等效果!
147 3
比Sora更王炸,LTX Studio文本生成超25秒,视频自带背景音乐、转场等效果!
|
Web App开发 XML 人工智能
文本转语音如此简单
这两天在研究文本转音的功能,有时候担心自己的普通话不标准,比方说要录制一个视频,即兴讲可能会卡壳,这个时候我们就可以先准备好文本,然后再利用人工智能来生成音频,下面就分享下我的研究成果吧!
1463 0
|
2月前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
63 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
4月前
|
搜索推荐 算法 Linux
这款文本转语音(TTS)
【8月更文挑战第6天】Fish Speech是一款先进的开源文本转语音(TTS)工具,它能迅速将文字转换为流畅自然的语音,尤其适合镜头前感到紧张的人制作视频内容。Fish Speech支持中文、英文及日文等多种语言,可通过简单的原始语音样本快速克隆个性化声音。其架构设计高效,仅需4GB显存即可运行,采用Flash-Attn算法实现高性能语音合成。Fish Speech具备易用性,提供Web界面操作,并可在Linux与Windows系统上部署。用户可通过官网([https://fish.audio/zh-CN/](https://fish.audio/zh-CN/))直接体验其强大功能。
344 0
|
4月前
|
机器学习/深度学习 编解码 自然语言处理
视频字幕生成案例
8月更文挑战第3天
223 0
|
5月前
|
语音技术
word文档生成视频,自动配音、背景音乐、自动字幕,另类创作工具
这是一个Markdown格式的摘要: --- 这款工具独特之处在于它允许用户通过在Word文档中添加文字和图片来创作视频,包括配音、字幕和背景音乐。软件界面虽显复杂,但生成视频只需四步:选择Word文档、添加音乐、设置保存路径、点击开始生成。最新版1.15b改进了字幕自动换行功能,支持手动调整,修复了网络错误、文件路径问题和图片缩放等错误。软件提供永久免费使用,支持离线生成(需自建TTS),并鼓励用户自定义TTS和特效插件。下载链接可在官方页面找到。 --- 请注意,实际字符数可能会根据Markdown格式的要求略有变动,但主要内容已经压缩在这个范围内。
|
6月前
|
Java
java实现视频和配音音频的合成
java实现视频和配音音频的合成
127 0
|
7月前
|
人工智能 自然语言处理 语音技术
音频提取字幕开源模型-whisper
音频提取字幕开源模型-whisper
186 0
|
机器学习/深度学习 人工智能 自然语言处理
文字、图片一键生成逼真音效,作者亲自揭秘音频AIGC模型
文字、图片一键生成逼真音效,作者亲自揭秘音频AIGC模型
319 0
|
Linux 语音技术 开发工具
巧用讯飞TTS进行文本合成语音(LINUX操作系统)
如果执行demo程序tts_offline_sample失败,那么请看下是否将libmsc.so有没有加载到ldconfig中。如果没有,则将libmsc.so放到/usr/lib64下,然后用root
巧用讯飞TTS进行文本合成语音(LINUX操作系统)