神器 pypandoc —— 实现电子书自由

简介: 知识就是力量,甚至说 知识就是金钱 更为合适。在信息时代的我们,获取知识,提升认知如同吃饭一样,成为了必须做的事情,阅读是最常用的获取知识的方式,没用之一。可是有时因为一些技术问题,导致我们阅读不便。

识就是力量,甚至说 知识就是金钱 更为合适。

在信息时代的我们,获取知识,提升认知如同吃饭一样,成为了必须做的事情,阅读是最常用的获取知识的方式,没用之一。

可是有时因为一些技术问题,导致我们阅读不便。

比如前几天,我想读一本 《人人都能用英语[1]》,找到了用 Markdown 写的原文,虽然可以阅读,但如何在手机上阅读,是个问题。

转为 Pdf,或者 html,虽然是可以,不过阅读起来很不方便,也记不住上次读到哪里了,更要命的是无法做笔记。

也搜了纸质书,因为这本书没用正式出版,所以也都是盗版的,就算了。

因为我经常用 多看APP 读书,如果能直接在多看上看就好了。

尝试了一圈,发现了一个好方法,现在我已经阅读过半了,体验很好,现在分享一下我的魔法过程。

解题思路

首先得知道,多看支持什么样的电子书格式,百度一下,特别全,为了更好的体验,决定转为 epub。

那么如何将 Markdown 转 epub 呢?一搜,发现有众多在线转服务,尝试了几个,不是收费就是各种限制,很不方便。

咱不是会编程吗?如果能自己搞岂不更好?

改变检索思路,很快发现了一个命令行工具 —— pandoc,进一步研究,发现竟然有 Python 版的 —— pypandoc,真是太棒了,研究一番,发现完全满足我的需求。

于是解决方案就是:

  1. 下载 markdown 版电子书
  2. 用 pypandoc 转化为 epub 格式
  3. 导入 多看, 阅读

开干!

神器出场

之所以喜欢 Python 有一个重要的原因就是安装和使用扩展很方便,几乎每个神器出场的方式都是一样的哈哈:

pip install pypandoc

友情提示:

最好创建一个虚拟环境来安装,这样不好影响其他库,也方便迁移,理解和创建虚拟环境可以参考 https://mp.weixin.qq.com/s/WflK5pOKhvPg8zrf_W5mfw

安装成功之后,可以测试一下:

>>> import pypandoc
>>> print(pypandoc.get_pandoc_version())
2.14.2

可见,我安装的版本是: 2.14.2

pandoc 是一个常用的软件,很多操作系统比如 Windows 可能已经内置

另外也可以单独安装,使用它的命令行工具,更多的 Pandoc 安装方式 和用法可以参考 pypandoc 说明[2]Pandoc 文档[3]

小试牛刀

翻看 pypandoc 说明,发现有个 convert_text 方法,可以用字符串的方式提供待转化的文本。

那先写一段 markdown 试试:

import pypandoc
input = "**Hello World!**"
output = pypandoc.convert_text(input, 'html', format='md')
print(output)

显示结果如下:

<p><strong>Hello World!</strong></p>

太棒了,将 **Hello World!** 转化成了一段 html 代码了。

再试点复杂的:

import pypandoc
input = """
# Pandoc
Pandoc 是个牛X的工具
## 用法
- `convert_text`
- `convert_file`
"""
output = pypandoc.convert_text(input, 'html', format='md')
print(output)

看看输出:

<h1 id="pandoc">Pandoc</h1>
<p>Pandoc 是个牛X的工具</p>
<h2 id="用法">用法</h2>
<ul>
<li><code>convert_text</code></li>
<li><code>convert_file</code></li>
</ul>

换一种输出格式呢?

output = pypandoc.convert_text(input, 'rst', format='md')

看看输出:

Pandoc
======
Pandoc 是个牛X的工具
用法
----
-  ``convert_text``
-  ``convert_file``

最好试试转化为 ePub 格式

ePub 格式无法输出为字符串,需要存入文件,所以需要用 加入 outputfile 参数

代码如下:

convert_test(input, 'epub', format='md', outputfile='test.epub')

用 EPUB File Reader 打开看看效果:

27.jpg

epub


生成电子书


测试了没问题后,就转化一个 Markdown 文件试试。

对于文件,需要用 convert_file 方法:

import pypandoc
convert_file('everyone-can-use-english.md', 'epub', 'md', outputfile='人人都能用英语.epub')

很快就能生成一个 epub 格式的电子书。

这里需要注意的是:引用的图片

如果是网络上的,需要将图片地址换成全网址,如果是相对的,需要保持目录结构,并提前准备好图片。

不然将无法生成图片,使电子书失去一定的可读性。

生成好了之后,可以将 人人都能用英语.epub 发送到手机上,用多看打开。

看看效果:


28.jpg

多看

之后就可以在书架里看到了:

简直太棒了,可以安心的读书了!

这下岂不实现了电子书自由啦!

总结

今天介绍了 pyPandoc 的简单用法 pyPandoc 不仅帮助我创建了电子书,而且让我理解了 Markdown 转化为 Html 的对应关系,为进步步打造自己的写作系统奠定了基础。

Pandoc 是个强大的工具,利用好,可以帮助我们实现电子书自由,加上会 Python 编程,就更厉害了。

期望这篇文章对你有用,祝你打造出自己的电子书系统,比心!



目录
相关文章
|
消息中间件 安全 Java
【RabbitMQ高级篇】消息可靠性问题
【RabbitMQ高级篇】消息可靠性问题
311 0
|
Linux iOS开发 MacOS
typora下载和破解(仅供学习)
Typora 一款 Markdown 编辑器和阅读器 风格极简 / 多种主题 / 支持 macOS,Windows 及 Linux 实时预览 / 图片与文字 / 代码块 / 数学公式 / 图表 目录大纲 / 文件管理 / 导入与导出 ……
162828 11
typora下载和破解(仅供学习)
conda常用操作和配置镜像源
conda常用操作和配置镜像源
29301 0
|
关系型数据库 数据库 PostgreSQL
PostgreSQL 数据库实例只读锁定(readonly) - 硬锁定,软锁定,解锁
PostgreSQL 数据库实例只读锁定(readonly) - 硬锁定,软锁定,解锁
2885 0
|
4月前
|
SQL JSON 数据格式
SPL 处理多层 JSON 数据比 DuckDB 方便多了
esProc SPL 处理多层 JSON 数据比 DuckDB 更便捷,尤其在保留 JSON 层次与复杂计算时优势明显。DuckDB 虽能通过 `read_json_auto()` 将 JSON 解析为表格结构,但面对深层次或复杂运算时,SQL 需频繁使用 UNNEST、子查询等结构,逻辑易变得繁琐。而 SPL 以集合运算方式直接处理子表,代码更简洁直观,无需复杂关联或 Lambda 语法,同时保持 JSON 原始结构。esProc SPL 开源免费,适合复杂 JSON 场景,欢迎至乾学院探索!
|
3月前
|
Java API 微服务
2025 年 Java 核心技术全面升级与实战应用详解
这份Java校招实操内容结合了最新技术趋势,涵盖核心技术、微服务架构、响应式编程、DevOps及前沿技术等六大模块。从函数式编程到Spring Cloud微服务,再到容器化与Kubernetes部署,帮助你掌握企业级开发技能。同时,提供AI集成、区块链实践和面试技巧,包括高频算法题与系统设计案例。通过学习这些内容,可应对90%以上的Java校招技术面试,并快速上手实际项目开发。资源链接:[点此获取](https://pan.quark.cn/s/14fcf913bae6)。
418 41
|
Linux 数据安全/隐私保护 Windows
更换(Pypi)pip源到国内镜像
pip国内的一些镜像 阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.
247094 2
|
11月前
|
自然语言处理 数据处理 Python
python操作和解析ppt文件 | python小知识
本文将带你从零开始,了解PPT解析的工具、工作原理以及常用的基本操作,并提供具体的代码示例和必要的说明【10月更文挑战第4天】
1787 60
|
数据采集 JSON NoSQL
JSON转Markdown:我把阅读数据从MongoDB中导出转换为.md了
JSON转Markdown:我把阅读数据从MongoDB中导出转换为.md了
1378 0
JSON转Markdown:我把阅读数据从MongoDB中导出转换为.md了
|
人工智能 自然语言处理 文字识别
MinerU-大语言语料处理神器,CPU/GPU均可跑,开源免费“敲”好用
在7月4日举行的WAIC 2024科学前沿主论坛上,书生·浦语2.5正式发布,面向大模型研发与应用的全链条工具体系同时迎来升级。
MinerU-大语言语料处理神器,CPU/GPU均可跑,开源免费“敲”好用