用Python解锁微软Edge的文本转语音服务

本文涉及的产品
语音服务,语音通知 50分钟
简介: 近来,TTS模型工具给大家也分享了不少,对于一些小白或有需要的人是提供了一个额外的选项。但作为编程人员/研发人员,或者需要集成TTS服务的人来说,好像又有点麻烦。今天就为大家分享一个非常有趣的项目—edge-tts。

近来,TTS模型工具给大家也分享了不少,对于一些小白或有需要的人是提供了一个额外的选项。


但作为编程人员/研发人员,或者需要集成TTS服务的人来说,好像又有点麻烦。


今天就为大家分享一个非常有趣的项目—edge-tts。

1720592624437.jpg

这个项目其实是一个 Python 三方模块,允许你使用 Microsoft Edge 的在线文本转语音服务,可以通过Python 代码进而使用提供的edge-tts和edge-playback命令。

可能你们会问,为什么要用这个模块?


简单来说,这个模块的效果媲美 ChatTTS,并且支持多种方言,比如粤语、陕西话和台湾话等,非常实用。


最主要的是,使用 edge-tts 不需要安装 Microsoft Edge 浏览器 或 借助Windows系统,也不需要 API 密钥。这意味着无论你用什么操作系统,只要有 Python 环境,就可以轻松上手。


项目地址在下方,有兴趣的朋友可以直接去 GitHub 查看项目详情。


GitHub项目地址:https://github.com/rany2/edge-tts

1720592706855.jpg

我们生活在一个信息爆炸的时代,每天都有大量的信息涌入我们的视野。如何高效地获取和处理这些信息,成为了每个人都需要面对的问题。


这里,文本转语音技术就派上了用场。从 AI 到人性化,试想一下,当你开车、跑步或者做家务时,能够通过耳朵获取信息,是不是大大提高了效率?这不仅仅是科技的进步,更是生活方式的改变。


而 edge-tts 更是将这种便捷性提升到了一个新的高度。我们不再需要复杂的配置,不再需要担心平台的兼容性,只需要简单的几行代码,就可以将文字转化为生动的语音。

而且,支持多种方言的特性,更是让它在实际应用中如虎添翼。想象一下,用陕西话给你的亲朋好友读一段文字,或者用粤语播放一则新闻,这种体验是非常独特且贴近生活的。


最开始的时候,可以试着用它来转换一些简单的文本。比如,将一些文章转化为语音,然后在跑步的时候听。这种体验非常新颖,感觉就像是有一个私人播音员随时随地为我们服务。


随着使用的深入,我开始尝试一些更复杂的应用场景。比如,将集成到我的一些自动化脚本中,帮助我在完成某些任务后,自动播报结果。当然我相信,edge-tts 的潜力远不止于此。

如何在 Python 代码中使用 edge-tts 模块?

1.安装 edge-tts 模块:

pip install edge-tts

2.在代码中导入 edge-tts 模块:

import edge_tts

3.创建 Communicate 对象:

communicate = edge_tts.Communicate()

4.使用 say() 方法将文本转换为语音:

communicate.say("你好,这是一个 edge-tts 的示例。")

5.如果需要将语音保存为音频文件,可以使用 save() 方法:

communicate.save("output.mp3", "你好,这是一个保存为音频文件的示例。")

6.如果需要立即播放语音,可以使用 play() 方法:

communicate.play("你好,这是一个立即播放的示例。")

当然,官方建议我们直接使用edge-tts和edge-playback两种命令行工具。


edge-playback: 将文本转换为语音并立即播放。


edge-tts: 将文本转换为语音并保存为音频文件。


比如使用edge-tts命令保存为MP3音频

$ edge-tts --text "走啊,出去吃火锅吧!" --write-media demo.mp3 --write-subtitles demo.vtt

比如使用edge-playback命令直接生成结果并播放音频

$ edge-playback --text "走啊,出去吃火锅吧!"

个别的参数说明:

  • --write-media:用于指定将生成的语音音频文件保存到哪个位置。
  • --write-subtitles:用于生成与语音同步的字幕文件。字幕文件默认为 .vtt 格式,可以用于视频播放器中显示字幕。
  • --language:指定语音,中文就在后面跟着写"zh-CN"
  • --gender:可设置男女音色, "female"/"male"。
  • --pitch:音高,取值范围为 -1.0 到 1.0。


像一些音量高低,速率大小等参数也可以进行自定义设置。

使用VoicesManager的动态语音(完整代码例子):

基础使用例子:

利用 edge-tts,可以做很多场景下的事情,不论做提效,还是做延伸产品,都是OK的。


上手很容易,无论你是技术小白,还是经验丰富的开发者,都可以从中找到乐趣和实用的价值。

相关文章
|
3月前
|
Python
python 找到并去除文本中的全部链接
这篇文章提供了一个使用Python正则表达式找到并删除文本中所有链接的代码示例。
|
11天前
|
机器学习/深度学习 自然语言处理 API
如何使用阿里云的语音合成服务(TTS)将文本转换为语音?本文详细介绍了从注册账号、获取密钥到编写Python代码调用TTS服务的全过程
如何使用阿里云的语音合成服务(TTS)将文本转换为语音?本文详细介绍了从注册账号、获取密钥到编写Python代码调用TTS服务的全过程。通过简单的代码示例,展示如何将文本转换为自然流畅的语音,适用于有声阅读、智能客服等场景。
54 3
|
1月前
|
自然语言处理 算法 数据挖掘
探讨如何利用Python中的NLP工具,从被动收集到主动分析文本数据的过程
【10月更文挑战第11天】本文介绍了自然语言处理(NLP)在文本分析中的应用,从被动收集到主动分析的过程。通过Python代码示例,详细展示了文本预处理、特征提取、情感分析和主题建模等关键技术,帮助读者理解如何有效利用NLP工具进行文本数据分析。
46 2
|
1月前
|
机器学习/深度学习 自然语言处理 大数据
使用Python进行文本情感分析
【10月更文挑战第2天】使用Python进行文本情感分析
30 3
|
2月前
|
Linux 开发者 iOS开发
Python中使用Colorama库输出彩色文本
Python中使用Colorama库输出彩色文本
|
2月前
|
安全
微软网站上关于在Edge浏览器中打开或关闭smartScreen的说明有误
微软网站上关于在Edge浏览器中打开或关闭smartScreen的说明有误
微软网站上关于在Edge浏览器中打开或关闭smartScreen的说明有误
|
2月前
|
XML 数据格式 Python
Python技巧:将HTML实体代码转换为文本的方法
在选择方法时,考虑到实际的应用场景和需求是很重要的。通常,使用标准库的 `html`模块就足以满足大多数基本需求。对于复杂的HTML文档处理,则可能需要 `BeautifulSoup`。而在特殊场合,或者为了最大限度的控制和定制化,可以考虑正则表达式。
62 12
|
2月前
|
机器学习/深度学习 自然语言处理 算法
使用Python实现简单的文本情感分析
【9月更文挑战第13天】本文将介绍如何使用Python编程语言进行基础的文本情感分析。我们将通过一个简单的例子,展示如何利用自然语言处理库nltk和机器学习库sklearn来实现对文本数据的情感倾向性判断。文章旨在为初学者提供一个入门级的指导,帮助他们理解并实践文本情感分析的基本步骤和方法。
36 6
|
2月前
|
机器学习/深度学习 存储 人工智能
文本情感识别分析系统Python+SVM分类算法+机器学习人工智能+计算机毕业设计
使用Python作为开发语言,基于文本数据集(一个积极的xls文本格式和一个消极的xls文本格式文件),使用Word2vec对文本进行处理。通过支持向量机SVM算法训练情绪分类模型。实现对文本消极情感和文本积极情感的识别。并基于Django框架开发网页平台实现对用户的可视化操作和数据存储。
50 0
文本情感识别分析系统Python+SVM分类算法+机器学习人工智能+计算机毕业设计
|
2月前
|
Python
在Python中,文本查找和替换的常用操作
在Python中,文本查找和替换的常用操作,使用字符串方法进行查找和替换,使用正则表达式进行查找和替换,对所查找到的内容进行计数。
30 1