ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: ebook2audiobookXTTS 是一款开源的 AI 工具,能够将电子书转换为有声书,支持多种电子书格式和 16 种语言。该工具利用 Coqui XTTS 技术实现高质量的文本到语音转换,并提供命令行、Web 界面和 Docker 容器等多种使用方式。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

功能:将多种电子书格式转换为有声书格式,支持高质量文本到语音转换。
多语言支持:支持 16 种语言,适应不同用户的需要。
易用性:提供命令行、Web 界面和 Docker 容器等多种使用方式。

正文(附运行示例)

ebook2audiobookXTTS 是什么

公众号: 蚝油菜花 - ebook2audiobookXTTS

ebook2audiobookXTTS 是一款开源的 AI 工具,旨在将电子书转换为有声书。该工具支持多种电子书格式,如 EPUB、PDF、MOBI 等,并利用 Coqui XTTS 技术实现高质量的文本到语音转换。

ebook2audiobookXTTS 不仅支持 16 种语言,还提供了命令行、Web 界面和 Docker 容器等多种使用方式,使得用户可以方便地进行操作。转换后的有声书格式为 .m4b,包含章节和元数据,便于在各种设备上收听。

ebook2audiobookXTTS 的主要功能

  • 格式转换:将多种电子书格式(如 EPUB、PDF、MOBI 等)转换为有声书格式(.m4b)。
  • 高质量 TTS:利用 Coqui XTTS 技术,实现接近真人发音的高质量文本到语音转换。
  • 多语言支持:支持包括英语、中文在内的 16 种语言,适应不同用户的需要。
  • 章节识别:自动识别电子书中的章节,并在有声书中创建相应的章节标记。
  • 元数据保留:保留电子书的元数据,如标题、作者、封面等,便于管理和识别。
  • 易用性:提供命令行界面、Web 界面和 Docker 容器等多种使用方式,方便用户操作。

ebook2audiobookXTTS 的技术原理

  • Calibre:Calibre 是一个强大的电子书管理和转换工具,能够处理多种电子书格式,包括 EPUB、MOBI、PDF 等。在 ebook2audiobookXTTS 中,Calibre 将电子书转换为文本格式,这是后续文本到语音(TTS)转换的前提。
  • Coqui XTTS:Coqui XTTS 是 Mozilla 的 Coqui 团队推出的一个文本到语音(TTS)系统。它利用深度学习技术生成自然听起来的语音,特点是能够创建具有特定声音特征的合成语音,在声音克隆和多语言支持方面表现出色。

如何运行 ebook2audiobookXTTS

安装依赖

  1. 安装 Python 3.x:从 Python.org 下载并安装。
  2. 安装 Calibre
  • Ubuntusudo apt-get install -y calibre
  • macOSbrew install calibre
  • Windows:在管理员 PowerShell 中运行 choco install calibre
  1. 安装 FFmpeg
  • Ubuntusudo apt-get install -y ffmpeg
  • macOSbrew install ffmpeg
  • Windows:在管理员 PowerShell 中运行 choco install ffmpeg
  1. 安装 Python 包
    pip install coqui-tts==0.24.2 pydub nltk beautifulsoup4 ebooklib tqdm gradio==4.44.0
    python -m nltk.downloader punkt
    python -m nltk.downloader punkt_tab
    

运行示例

启动 Gradio Web 界面

  1. 运行脚本
    python app.py
    
  2. 打开 Web 应用:点击终端中提供的 URL 访问 Web 应用并转换电子书。

基本无头模式使用

python app.py --headless True --ebook <path_to_ebook_file> --voice [path_to_voice_file] --language [language_code]

使用 Docker

运行 Docker 容器

  • 仅使用 CPU
    docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py
    
  • 使用 GPU 加速
    docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py
    

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
3天前
|
人工智能 前端开发 小程序
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
|
1天前
|
机器学习/深度学习 人工智能 算法
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
FinRobot 是一个开源的 AI Agent 平台,专注于金融领域的应用,通过大型语言模型(LLMs)构建复杂的金融分析和决策工具,提供市场预测、文档分析和交易策略等多种功能。
39 13
FinRobot:开源的金融专业 AI Agent,提供市场预测、报告分析和交易策略等金融解决方案
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
32 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
3天前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
46 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
1天前
|
机器学习/深度学习 人工智能 编解码
VideoVAE+:AI 生成视频高保真重建和跨模态重建工具,基于文本信息指导视频重建,提升视频细节质量
VideoVAE+ 是香港科技大学推出的先进跨模态视频变分自编码器,通过时空分离压缩机制和文本指导,实现了高效视频压缩与精准重建。
24 7
VideoVAE+:AI 生成视频高保真重建和跨模态重建工具,基于文本信息指导视频重建,提升视频细节质量
|
3天前
|
人工智能 自然语言处理 Java
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
FastExcel 是一款基于 Java 的高性能 Excel 处理工具,专注于优化大规模数据处理,提供简洁易用的 API 和流式操作能力,支持从 EasyExcel 无缝迁移。
44 9
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
|
3天前
|
存储 人工智能 自然语言处理
效率翻倍!2024免费AI流程图生成工具评测
2分钟了解有哪些好用的AI流程图生成工具。
38 4
效率翻倍!2024免费AI流程图生成工具评测
|
1天前
|
人工智能 移动开发 JavaScript
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
|
5天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
133 97

热门文章

最新文章