利用Python快速提取字体子集

简介: 利用Python快速提取字体子集

在我们日常进行数据可视化、web应用开发等场景中,经常会用到一些特殊的非系统自带字体,尤其是中文字体,由于包含的字符数量众多,因此体积一般都比较大,这在进行数据可视化读取字体文件,或是网页应用中通过网络加载字体文件时,就会带来更多的耗时。

而我们完全可以针对字体文件运用“按需引入”的思想,从原始的体积较大的全量字体文件中,根据我们实际使用到的文字范围,进行子集的提取,从而大幅度提升效率。

我们可以利用Python中的fonttools库来快捷实现此项需求,它由谷歌开源,自带了若干实用的字体处理相关命令行工具,使用pip install fonttools安装完成后,我们只需要按照下列格式执行命令行工具pyftsubset即可:

pyftsubset 原始字体文件路径 --text=需要保留的字符 --output-file=输出子集字体文件路径

而当我们需要进行保留的字符众多时,则可以通过书写Python脚本的方式,批量拼接命令行进行模拟执行:

import os
import re
# 读入目标文本内容
with open('./将进酒.txt', encoding='utf-8') as t:
    source_content = t.read()
    
# 模拟执行pyftsubset命令生成字体子集
os.system(
    'pyftsubset 钟齐志莽行书.ttf --text={} --output-file=钟齐志莽行书mini.ttf'.format(
        # 去除空白字符后去重
        ''.join(set(re.sub('\s', '', source_content)))
    )
)

通过上面的示例代码,我们从本地原体积为4698kb的字体文件中,提取出大小仅有76kb的目标子集字体文件:

dad678323c202890560a93627ec8fab8.png

在此基础上,我们就可以在项目中「大幅度」优化外部字体的使用效率😉,譬如下面的示例dash应用(相关源码及文件已上传至文章开头仓库):

相关文章
|
3月前
|
Python
【Leetcode刷题Python】416. 分割等和子集
LeetCode 416题 "分割等和子集" 的Python解决方案,使用动态规划算法判断是否可以将数组分割成两个元素和相等的子集。
26 1
|
3月前
|
索引 Python
【Leetcode刷题Python】78. 子集
LeetCode题目78的Python编程解决方案,题目要求给定一个互不相同的整数数组,返回该数组所有可能的子集(幂集),且解集中不能包含重复的子集。
20 1
|
5月前
|
Python
利用Python控制终端打印字体的颜色和格式
利用Python控制终端打印字体的颜色和格式
72 2
|
4月前
|
机器学习/深度学习 缓存 安全
Python标准库中的`str`类型有一个`translate()`方法,它用于替换字符串中的字符或字符子集。这通常与`str.maketrans()`方法一起使用,后者创建一个映射表,用于定义哪些字符应该被替换。
Python标准库中的`str`类型有一个`translate()`方法,它用于替换字符串中的字符或字符子集。这通常与`str.maketrans()`方法一起使用,后者创建一个映射表,用于定义哪些字符应该被替换。
|
4月前
|
Python
【python】PyCharm如何设置字体大小和背景
【python】PyCharm如何设置字体大小和背景
|
6月前
|
Python
利用Python生成一个列表的所有子集
利用Python生成一个列表的所有子集
154 0
|
开发者 Python
Python 操作 Excel 全攻略 | 包括读取、写入、表格操作、图像输出和字体设置
Python 操作 Excel 全攻略 | 包括读取、写入、表格操作、图像输出和字体设置
1455 0
|
6月前
|
Python 索引 Java
Python每日一练(20230406) 环形链表 II、反转链表、子集 II
Python每日一练(20230406) 环形链表 II、反转链表、子集 II
35 0
Python每日一练(20230406) 环形链表 II、反转链表、子集 II
|
6月前
|
Python
python-docx 创建word 设置字体 字号 颜色 居中
python-docx 创建word 设置字体 字号 颜色 居中
88 0
|
Python
python画雷达图更换自定义字体,然后把图片发邮件
python画雷达图更换自定义字体,然后把图片发邮件,解决画图字体不显示或者想自定义字体,发邮件使用两种方式,实现发送图片作为邮件正文的效果
94 0