🐭喂汁,用Python写个专属Markdown转换工具(上)

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 一直使用 Markdown 语法编写文章,然后用Markdown转换工具转换下

0x1、需求分析


一直使用 Markdown 语法编写文章,然后用Markdown转换工具转换下,常用的工具有:






转换后的文章样式(以Md2All为例):


网络异常,图片无法展示
|


还行,简洁够用。但,人总是很难满足于现状,三个诱因让我有了改变的念头:


  • 工具毕竟不是开源的,你用别人也用,样式烂大街,都是改改颜色,替换图片、审美疲劳;


  • 老弟给我安利的公号编辑插件,如新媒体管家(已凉),壹伴助手,秀米,135、小蚂蚁等;


作为漆黑中的萤火虫,怎甘平平无奇,于是花了点时间,来定制自己的文章排版~


在参(chao)考(xi)完多个公号后,整理了自己的公号排版规范,有需要的可以参考一波~


# 字号:正文(14、15),注释-标注来源-超链接-代码(12)
# 字间距:(1、1.5)
# 行间距:(1.5、1.75、2)
# 页边距:即双端缩进、两端对齐,页面左右留白,建议缩进尺寸为1.0
# 字体颜色:标题 #000000;正文 #4C4C4C;标注 #888888;其他 #B2B2B2
# 正文也可以尝试:#545454;#3f3f3f;#7f7f7f;#2f2f2f
# 备注性文字:#a5a5a5
# Tips:除去字体颜色,公号排版颜色不宜超过三种,颜色一旦多起来,风格就很难定,2-3种尤佳;
# 比如我的三种颜色:蕾姆蓝#5A78EA;拉姆粉#FF4081;艾米莉亚:#C65BDA
# 符号系统:建立自己的符号系统,用作内容分割,比如用//////////作为正文大段落的分隔,- 作为段落小结的分隔,有时还可以使用一些表情符号来增加趣味性:http://cn.piliapp.com/symbol/
# 不管怎么排,要有自己固定的设置,如:段落和图片间空2行、图片大小控制在一屏版面的1/3面积内、一个段落不超过3行字、每当一屏版面文字太满时,拆解段落做分段或做一些highlight制造空间感等。
# 总而言之,尽量利用 简单的基础设置 去优化阅读体验,让整体排版看起来简洁但有序、不密集、不沉重、不压抑。
# 采用固定格式的公号封面图!!! 
# 固定版式形成强烈的个人特色,制作新的封面图只需置换文字和图片,好看又方便。


具体效果可以看下:mp.weixin.qq.com/s/why-ikTbb…


大概的样式,其实就下面这几种:


网络异常,图片无法展示
|


而每次写完文章,想发布到公号,我需要这样:


复制文章内容()
无格式粘贴到公号文章编辑处()
for(其中一行:所有内容) {
    when(其中一行) {
        is 一级标题 → 应用一级标题样式
        is 二级标题 → 应用一级标题样式
        is 正文 → 应用正文样式
        ...
    }
}


机器重复,费事费力费神,特别是表格复制粘贴,令人绝望,文章内容多的时候,得花上半把小时,热情也被消磨殆尽... 迫切需一种工具,帮我跳出这样的困境,不能全自动,也要尽可能减少我花在排版上的时间。


0x2、工具设计


转换工具的核心:→ 解析Markdown文件对特定类型元素进行渲染生成HTML文件


这里的渲染,其实没那么高深,以 Md2All工具为例,输入:# 一级标题


网络异常,图片无法展示
|


点击复制,然后随便贴到一个IDE,保存为.html后缀,格式化一下:


网络异常,图片无法展示
|


因为微信公众号文章不支持CSS和JS(不过支持SVG),所以只能在HTML标签里写内联样式。 所以,这里的渲染其实只是:当解析到特定类型元素时,替换成对应的带内联样式的HTML代码


所以,想写这样的工具,要点就是:


  • ① 解析Markdown,能对不同类型的元素做区分;
  • ② 各种带有样式的HTML代码;


先是解析Markdown的问题,秉着有轮子就不自己造的精神,直接搜关键字Python MarkDown解析,在众多的库中选择了mistune


而样式HTML的获取,就简单多了,善用Chrome开发者工具的Elements即可,比如:


网络异常,图片无法展示
|


看上的样式,直接偷


当然,获取到的样式可能还需要微调下,接着到工具开发环节~


0x3、我啪的就站起来了,很快嗷


上面也说了,使用浑元功法(mistune),来解析Markdown,简要介绍下此库:



直接用pip命令安装一波:


pip install mistune==2.0.0a4


用法也很简单,写个简单的Demo体验体验:


网络异常,图片无法展示
|


默认渲染样式显然不能满足我们的需求,需要自定义渲染器,定义一个渲染器 mistune.HTMLRenderer 的子类,重写相应的函数即可。同样写个简单例子,以#、##的解析为例:


网络异常,图片无法展示
|


运行输出结果如下:


网络异常,图片无法展示
|


接着塞到文章编辑器里验证下,微信不支持粘贴源码,借助开发者工具,定位到正文元素,右键选中:


网络异常,图片无法展示
|


粘贴一波:


网络异常,图片无法展示
|


回到编辑器看下效果:


网络异常,图片无法展示
|


可以,跟预期一致,大概玩法就这样,接着就是具体逻辑的细化及优化了。更多渲染器中可供重写的函数可以参见下述链接:mistune.readthedocs.io/en/latest/a…


0x4、松果弹抖闪电鞭


接着是记录开发此工具的细节,有兴趣想自定义的可以借鉴一波,不感兴趣的直接跳过用成品亦可,后续会慢慢更新一些主题,也欢迎投稿~


① 一鞭 → 样式采集示例


因为用的壹伴助手插件,复制元素的时候带了点没用的东西:


网络异常,图片无法展示
|


有些洁癖,写个正则清洗一下:


网络异常,图片无法展示
|


清洗完:


网络异常,图片无法展示
|


强迫症作祟,格式化下代码,这里用的lxml,你也可以用BeautifulSoup或者其他:


网络异常,图片无法展示
|


看下效果:


网络异常,图片无法展示
|


可以,舒适感up↑,后续采集到的样式,先放这个池子里清洗一下,再用,也可添加新的过滤规则。


样式搞到手了,接着就该想想怎么存了,总不能像Demo那里一样,复制一堆字符串吧。繁冗不说,复用性也差,这里引入模板的概念,将每个样式保存成单个html,用到传参渲染,此处使用jinja2模板库


pip命令安装一波:


pip install Jinja2


接着把文本部分,替换成一个变量text:


网络异常,图片无法展示
|


再接着使用jinja2获取模板并渲染:


网络异常,图片无法展示
|


输出结果如下:


网络异常,图片无法展示
|


可以,很强,关于Jinja2的具体用法可参见:




创建模板,使用模板渲染的流程就这样,接下来演示下每种样式的具体获取过程。


相关文章
|
12天前
|
JavaScript 前端开发 开发者
探索 DrissionPage: 强大的Python网页自动化工具
DrissionPage 是一个基于 Python 的网页自动化工具,结合了浏览器自动化的便利性和 requests 库的高效率。它提供三种页面对象:ChromiumPage、WebPage 和 SessionPage,分别适用于不同的使用场景,帮助开发者高效完成网页自动化任务。
64 4
|
2月前
|
iOS开发 MacOS Python
【10月更文挑战第1天】「Mac上学Python 1」入门篇1 - 安装Typora与Markdown编辑技巧
本篇将详细介绍如何在Mac系统上安装Typora这款简洁高效的Markdown编辑器,并学习Markdown常用语法。通过本篇,用户能够准备好记录学习笔记的工具,并掌握基本的文档编辑与排版技巧,为后续学习提供便利。
155 1
【10月更文挑战第1天】「Mac上学Python 1」入门篇1 - 安装Typora与Markdown编辑技巧
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
34 2
|
2月前
|
C语言 开发者 Python
探索Python中的列表推导式:简洁而强大的工具
【10月更文挑战第21天】在Python的世界里,代码的优雅与效率同样重要。列表推导式(List Comprehensions)作为一种强大而简洁的工具,允许开发者通过一行代码完成对列表的复杂操作。本文将深入探讨列表推导式的使用方法、性能考量以及它如何提升代码的可读性和效率。
|
2月前
|
自然语言处理 算法 数据挖掘
探讨如何利用Python中的NLP工具,从被动收集到主动分析文本数据的过程
【10月更文挑战第11天】本文介绍了自然语言处理(NLP)在文本分析中的应用,从被动收集到主动分析的过程。通过Python代码示例,详细展示了文本预处理、特征提取、情感分析和主题建模等关键技术,帮助读者理解如何有效利用NLP工具进行文本数据分析。
52 2
|
2月前
|
测试技术 Python
Python MagicMock: Mock 变量的强大工具
Python MagicMock: Mock 变量的强大工具
|
2月前
|
存储 Python
python数据类型、debug工具(一)
python数据类型、debug工具(一)
|
1月前
|
C语言 Python
探索Python中的列表推导式:简洁而强大的工具
【10月更文挑战第24天】在Python编程的世界中,追求代码的简洁性和可读性是永恒的主题。列表推导式(List Comprehensions)作为Python语言的一个特色功能,提供了一种优雅且高效的方法来创建和处理列表。本文将深入探讨列表推导式的使用场景、语法结构以及如何通过它简化日常编程任务。
|
2月前
|
网络协议 IDE iOS开发
Python编程---简单的聊天工具
Python编程---简单的聊天工具
|
2月前
|
数据处理 开发者 Python
Python编程中的列表推导式:简洁而强大的工具
【9月更文挑战第35天】在Python的众多特性中,列表推导式以其简明扼要和强大功能脱颖而出。本文不仅将介绍列表推导式的基础知识,还将探讨其背后的逻辑,并辅以实际代码示例。无论你是初学者还是有经验的开发者,都能从中获取新的见解和应用技巧。
34 5