文件格式转换工具-Pandoc

简介: Pandoc是由John MacFarlane开发的标记语言转换工具,可实现不同标记语言间的格式转换,堪称该领域中的“瑞士军刀”。Pandoc使用Haskell语言编写,以命令行形式实现与用户的交互,可支持多种操作系统。

Pandoc是由John MacFarlane开发的标记语言转换工具,可实现不同标记语言间的格式转换,堪称该领域中的“瑞士军刀”。
Pandoc使用Haskell语言编写,以命令行形式实现与用户的交互,可支持多种操作系统。

通俗来说,pandoc是一个实现文件格式转换的工具,比如可以把html文件转换为txt文件,markdown文件,或各种pandoc支持的文件类型。pandoc支持的文件类型非常的多,常见的类型肯定是包含进去的,可以看下图。

img_3aaf57e53f64bda545c24b592aaf6bf9.png
pandoc格式转换映射图

安装

brew install pandoc
  • Linux上在主流的发行版本上,可以直接使用包管理器安装。也可以下载二进制版本。下载地址,在Centos上可直接安装。
yum install pandoc

案例

  1. 查看pandoc支持的格式
pandoc -h  #help的开头部分, linux
# mac版本
pandoc  --list-input-formats
pandoc  --list-output-formats
  1. 转换为html片段
pandoc demo.txt -o demo.html
img_f8f9614194e110dc759994703239172c.png
pandoc demo
  1. 转换为完整的html文件,同时追加头部与样式
pandoc -s --toc -c demo.css -A footer.html demo.txt -o demo.html
img_e61b465a46ae8c68b8e61e63442cf600.png
image.png
  1. 使用pandoc创建电子书
    链接
pandoc -o progit.epub title.txt \
  01-introduction/01-chapter1.markdown \
  02-git-basics/01-chapter2.markdown \
  03-git-branching/01-chapter3.markdown \
  04-git-server/01-chapter4.markdown \
  05-distributed-git/01-chapter5.markdown \
  06-git-tools/01-chapter6.markdown \
  07-customizing-git/01-chapter7.markdown \
  08-git-and-other-scms/01-chapter8.markdown \
  09-git-internals/01-chapter9.markdown

  1. html文件转换为markdown文件
pandoc -s  demo.html -t markdown
img_402e15f64d1cd274e04c31b5020bc873.png
image.png

额外

pandoc还提供了一些常用的轻量级编辑器的扩展,sublime-pandoc,atom-pandoc等等。

最后

pandoc可以解决平时我们在文件格式上处理的问题,它还提供了一个在线的转换demo。

尝试在线pandoc转换

参考

目录
相关文章
|
5月前
|
JavaScript 前端开发
nodejs实现解析chm文件列表,无需转换为PDF文件格式,在线预览chm文件以及目录,不依赖任何网页端插件
nodejs实现解析chm文件列表,无需转换为PDF文件格式,在线预览chm文件以及目录,不依赖任何网页端插件
|
缓存 API 定位技术
.tpk格式文件简介
1、.tpk格式的文件是什么?       tpk是ArcGIS10.1推出的一种新的数据文件类型,主要是用于将切片文件打包形成离线地图包,tpk可以在ArcGIS Runtime或者ArcGIS for Android/iOS中作为切片底图被加载。
3275 0
|
5月前
在vscode下将ipynb文件转成markdown(.md文件)的方法
在vscode下将ipynb文件转成markdown(.md文件)的方法
200 0
|
Python
python文件过滤,pdf转swf
python文件过滤,pdf转swf
小工具随手记:使用Python的docx库将.docx文件中的图片提取并保存为.jpeg
小工具随手记:使用Python的docx库将.docx文件中的图片提取并保存为.jpeg
小工具随手记:使用Python的docx库将.docx文件中的图片提取并保存为.jpeg
|
JSON 数据格式 Python
Win10系统下安装labelme,json文件批量转化
Win10系统下安装labelme,json文件批量转化一、安装环境:windows10,anaconda3,python3.6 由于框架maskrcnn需要json数据集,在没安装labelme环境和跑深度学习之前,我安装的是anaconda3,其中pyhton是3.7版本的,经网上查阅资料,经过一番查找资料,发现,原来在2019年,TensorFlow还不支持python3.7,所以,迫于无奈,我只能乖乖把python的版本退回到3.6版本,具体步骤也很简单。
2440 0
|
测试技术 iOS开发 MacOS
如何把 Markdown 文件批量转换为 pdf?
需求 有个朋友提出,希望把目录中的许多 markdown 文件,批量转换为对应名称的 pdf 格式文件。我于是编写了一个 Python 脚本,并且分享给你。
2094 0
|
Web App开发 编解码 数据安全/隐私保护
python-尝试将Excel文件保存为图片并加上水印
python-尝试将Excel文件保存为图片并加上水印 场景:并不是将 excel 的 chart 生成图片,而是将整个表格内容生成图片。 1. 准备工作 目前搜索不到已有的方法,只能自己尝试写一个,想法有两个: 通过 Python 的图片处理库PIL,将 Excel 内信息逐写到图片上; 通过另存为 HTML 文件,利用Phantomjs的截图工具,截取到 HTML 。
5621 0