ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言

本文涉及的产品
图像搜索,任选一个服务类型 1个月
简介: ebook2audiobookXTTS 是一款开源的 AI 工具,能够将电子书转换为有声书,支持多种电子书格式和 16 种语言。该工具利用 Coqui XTTS 技术实现高质量的文本到语音转换,并提供命令行、Web 界面和 Docker 容器等多种使用方式。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

功能:将多种电子书格式转换为有声书格式,支持高质量文本到语音转换。
多语言支持:支持 16 种语言,适应不同用户的需要。
易用性:提供命令行、Web 界面和 Docker 容器等多种使用方式。

正文(附运行示例)

ebook2audiobookXTTS 是什么

公众号: 蚝油菜花 - ebook2audiobookXTTS

ebook2audiobookXTTS 是一款开源的 AI 工具,旨在将电子书转换为有声书。该工具支持多种电子书格式,如 EPUB、PDF、MOBI 等,并利用 Coqui XTTS 技术实现高质量的文本到语音转换。

ebook2audiobookXTTS 不仅支持 16 种语言,还提供了命令行、Web 界面和 Docker 容器等多种使用方式,使得用户可以方便地进行操作。转换后的有声书格式为 .m4b,包含章节和元数据,便于在各种设备上收听。

ebook2audiobookXTTS 的主要功能

  • 格式转换:将多种电子书格式(如 EPUB、PDF、MOBI 等)转换为有声书格式(.m4b)。
  • 高质量 TTS:利用 Coqui XTTS 技术,实现接近真人发音的高质量文本到语音转换。
  • 多语言支持:支持包括英语、中文在内的 16 种语言,适应不同用户的需要。
  • 章节识别:自动识别电子书中的章节,并在有声书中创建相应的章节标记。
  • 元数据保留:保留电子书的元数据,如标题、作者、封面等,便于管理和识别。
  • 易用性:提供命令行界面、Web 界面和 Docker 容器等多种使用方式,方便用户操作。

ebook2audiobookXTTS 的技术原理

  • Calibre:Calibre 是一个强大的电子书管理和转换工具,能够处理多种电子书格式,包括 EPUB、MOBI、PDF 等。在 ebook2audiobookXTTS 中,Calibre 将电子书转换为文本格式,这是后续文本到语音(TTS)转换的前提。
  • Coqui XTTS:Coqui XTTS 是 Mozilla 的 Coqui 团队推出的一个文本到语音(TTS)系统。它利用深度学习技术生成自然听起来的语音,特点是能够创建具有特定声音特征的合成语音,在声音克隆和多语言支持方面表现出色。

如何运行 ebook2audiobookXTTS

安装依赖

  1. 安装 Python 3.x:从 Python.org 下载并安装。
  2. 安装 Calibre
  • Ubuntusudo apt-get install -y calibre
  • macOSbrew install calibre
  • Windows:在管理员 PowerShell 中运行 choco install calibre
  1. 安装 FFmpeg
  • Ubuntusudo apt-get install -y ffmpeg
  • macOSbrew install ffmpeg
  • Windows:在管理员 PowerShell 中运行 choco install ffmpeg
  1. 安装 Python 包
    pip install coqui-tts==0.24.2 pydub nltk beautifulsoup4 ebooklib tqdm gradio==4.44.0
    python -m nltk.downloader punkt
    python -m nltk.downloader punkt_tab
    

运行示例

启动 Gradio Web 界面

  1. 运行脚本
    python app.py
    
  2. 打开 Web 应用:点击终端中提供的 URL 访问 Web 应用并转换电子书。

基本无头模式使用

python app.py --headless True --ebook <path_to_ebook_file> --voice [path_to_voice_file] --language [language_code]

使用 Docker

运行 Docker 容器

  • 仅使用 CPU
    docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py
    
  • 使用 GPU 加速
    docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py
    

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
AI可以做电商主图了:技术原理,AI电商图生成工具对比及技术解析
双十一临近,电商主图需求激增。AI技术凭借多图融合、扩散模型等,实现高效智能设计,30秒生成高质量主图,远超传统PS效率。支持风格迁移、背景替换、文案生成,助力商家快速打造吸睛商品图,提升转化率。
691 0
|
2月前
|
人工智能 搜索推荐 数据可视化
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
328 115
|
2月前
|
人工智能 安全 搜索推荐
AI的下一个前沿:从静态工具到动态代理
AI的下一个前沿:从静态工具到动态代理
223 113
|
2月前
|
人工智能 自然语言处理 安全
从工具到伙伴:AI代理(Agent)是下一场革命
从工具到伙伴:AI代理(Agent)是下一场革命
262 117
|
2月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
3278 46
|
2月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
427 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
2月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
254 5
我们开源了一款 AI 驱动的用户社区
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
双 11 电商效率突围:10 款 AI 工具的技术落地与实践指南
2025年双11促销长达38天,电商迎来AI重构关键期。本文剖析10款主流AI工具技术原理,涵盖设计、文案、投放、客服等场景,揭示计算机视觉、自然语言处理等技术如何驱动电商智能化升级,助力企业高效应对大促挑战。
363 1
|
2月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
418 29

热门文章

最新文章