Python pyttsx3|文本朗读(各种语言)

简介: Python pyttsx3使用教程

 Python文字转语音

程序员,在其他人眼中往往都是高冷的存在,在他们的眼中能用代码解决的问题绝对不考虑其他的方法,本文让我们用Python来提升一下高冷的档次,让我们用代码来“说话”。

安装pyttsx3

安装

下面就让我们来看一下Python是怎样开口“说话“的。

我们先安装需要的库pyttsx3:

pipinstallpyttsx3

image.gif

语音引擎工厂

类似于设计模式中的“工厂模式”,pyttsx3通过初始化来获取语音引擎。当我们第一次调用init操作的时候,会返回一个pyttsx3的engine对象,再次调用的时候,如果存在engine对象实例,就会使用现有的,否则再重新创建一个。

pyttsx.init([driverName : string, debug : bool]) pyttsx.Engine

image.gif

从方法声明上来看,第一个参数指定的是语音驱动的名称,这个在底层适合操作系统密切相关的。如下:

     1.drivename:由pyttsx3.driver模块根据操作系统类型来调用,默认使用当前操作系统可以使用的最好的驱动。

           sapi5 - SAPI5 on Windows

           nsss - NSSpeechSynthesizer on Mac OS X

           espeak - eSpeak on every other platform

     2.debug: 这第二个参数是指定要不要以调试状态输出,建议开发阶段设置为True。

函数说明

本节我们再来了解一下pyttsx3.engine.Engine中所对应的函数说明。

- connect

参数:

 topic(string):要描述的事件名称;

 cb(callable):回调函数。

返回值:

 dict

函数说明:

 在给定的topic上添加回调通知

- disconnect

参数:

 token(dict):回调失联的返回标记

返回值:

 Void

函数说明:

 结束连接

- endLoop

函数说明:

 简单来说就是结束事件循环

- getProperty

参数:

 name(string):rate: 每分钟字数的语音速率,默认为每分钟200个。

  name(string):voice: 语音的字符串标识符。

  name(string):voices: pyttsx3.voice.Voice描述符对象列表。

  name(string):volume:音量的大小。

返回值:

 Object

函数说明:

 获取当前引擎实例的属性值。

- setProperty

参数:

 name(string):rate: 每分钟字数的语音速率,默认为每分钟200个。

  name(string):voice: 语音的字符串标识符。

  name(string):volume:音量的大小。

 value(int):rate: 设置每分钟读的字数。

 value:voice:设置发音,后文中会再讲到。

 valu(float):volume:设置音量大小,0.0-1.0之间;默认1.0。

返回值:

 Object

函数说明:

 获取当前引擎实例的属性值。

- say

参数:

 text(unicode):要进行朗读的文本数据。

 name(strin):关联发音人(一般用不到)

函数说明:

 预设要朗读的文本数据

- runAndWait

函数说明:

  当事件队列中事件全部清空的时候返回。

- startLoop

参数:

  [useDriverLoop(bool)]:是否启用驱动循环。

函数说明:

  开启事件队列

- stop

函数说明:

  停止当前讲话并清除命令队列。

简单的中文发音

先来让我们学习一下最简单的“说话”方法,我们不需要进行任何的设置,只要传入想要朗读的文本就可以了。

# 语音播报模块importpyttsx3# 模块初始化engine=pyttsx3.init() 
print('准备开始语音播报...')
engine.say('我高冷,我并不想说话~')
# 等待语音播报完毕 engine.runAndWait()

image.gif

设置参数的发音方式

在进行设置参数的发音方式的时候,我们需要注意一点,在该模块的内置声音选择函数执行的时候将并不能匹配中文发音,所以我们用英文来进行一下默认参数的尝试。

# 语音播报模块importpyttsx3# 模块初始化engine=pyttsx3.init()
print('准备开始语音播报...')
# 设置发音速率,默认值为200rate=engine.getProperty('rate')
engine.setProperty('rate', rate-50)
# 设置发音大小,范围为0.0-1.0volume=engine.getProperty('volume')
engine.setProperty('volume', 0.6)
# 设置默认的声音:voices[0].id代表男生,voices[1].id代表女生voices=engine.getProperty('voices')
engine.setProperty('voice', voices[1].id)
# 添加朗读文本engine.say('Not everyone can become a great artist.')
# 等待语音播报完毕engine.runAndWait()

image.gif

有趣的中文方言发音

虽然在内置的发音方式中我们不能更换音色,但是经过一番查找后我发现,我们还可以去调用其他的语音播报API,这样就完美的解决了更改发音的问题,并且还能支持很多方言,来用我们最开始听到的语音播报来举个例子,代码如下:

# 语音播报模块importpyttsx3msg='''今天我,寒夜里看雪飘过怀着冷却了的心窝漂远方风雨里追赶,雾里分不清影踪天空海阔你与我可会变(谁没在变)多少次,迎着冷眼与嘲笑从没有放弃过心中的理想一刹那恍惚, 若有所失的感觉不知不觉已变淡心里爱(谁明白我)原谅我这一生不羁放纵爱自由也会怕有一天会跌倒背弃了理想 ,谁人都可以哪会怕有一天只你共我'''# 模块初始化engine=pyttsx3.init()
volume=engine.getProperty('volume')
# 标准的粤语发音voices=engine.setProperty(
'voice', "com.apple.speech.synthesis.voice.sin-ji")
# 普通话发音# voices = engine.setProperty(#     'voice', "com.apple.speech.synthesis.voice.ting-ting.premium")# 台湾甜美女生普通话发音# voices = engine.setProperty(  #     'voice', "com.apple.speech.synthesis.voice.mei-jia")print('准备开始语音播报...')
# 输入语音播报词语engine.setProperty('volume', 0.7)
engine.say(msg)
engine.runAndWait()
engine.stop()

image.gif

是不是很有趣,点个赞再走吧~

相关文章
|
9天前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
180 102
|
9天前
|
人工智能 自然语言处理 算法框架/工具
Python:现代编程的首选语言
Python:现代编程的首选语言
173 103
|
9天前
|
机器学习/深度学习 人工智能 数据挖掘
Python:现代编程的首选语言
Python:现代编程的首选语言
118 82
|
1月前
|
机器学习/深度学习 自然语言处理 数据可视化
Python:简洁而强大的通用语言
Python:简洁而强大的通用语言
|
1月前
|
机器学习/深度学习 人工智能 运维
Python:简洁高效的万能语言
Python:简洁高效的万能语言
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
Python:简洁高效的万能“胶水语言”
Python:简洁高效的万能“胶水语言”
|
2月前
|
JavaScript Java Go
Go、Node.js、Python、PHP、Java五种语言的直播推流RTMP协议技术实施方案和思路-优雅草卓伊凡
Go、Node.js、Python、PHP、Java五种语言的直播推流RTMP协议技术实施方案和思路-优雅草卓伊凡
167 0
|
2月前
|
JSON JavaScript 前端开发
Python+JAVA+PHP语言,苏宁商品详情API
调用苏宁商品详情API,可通过HTTP/HTTPS发送请求并解析响应数据,支持多种编程语言,如JavaScript、Java、PHP、C#、Ruby等。核心步骤包括构造请求URL、发送GET/POST请求及解析JSON/XML响应。不同语言示例展示了如何获取商品名称与价格等信息,实际使用时请参考苏宁开放平台最新文档以确保兼容性。
|
4月前
|
存储 机器学习/深度学习 人工智能
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
1285 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
|
9月前
|
Unix 编译器 C语言
[oeasy]python052_[系统开发语言为什么默认是c语言
本文介绍了C语言为何成为系统开发的首选语言,从其诞生背景、发展历史及特点进行阐述。C语言源于贝尔实验室,与Unix操作系统相互促进,因其简洁、高效、跨平台等特性,逐渐成为主流。文章还提及了C语言的学习资料及其对编程文化的影响。
91 5

推荐镜像

更多