一日一技:如何判断某个汉字是不是在字体库中

简介: 一日一技:如何判断某个汉字是不是在字体库中

摄影:产品经理下厨:kingname

我们喜欢从网上下载各种各样的中文字体,但这些字体一般只设计了常用汉字,遇到生僻字时就会变成系统默认字体。如下图所示为方正静蕾简体,没有“龍鑨”两个汉字:

现在,我手上有10000个汉字,我如何快速确定哪些汉字在这个字体库中呢?

为了解决这个问题,我们需要安装 Python 的一个第三方库:fontTools

首先我们来安装它:

python3 -m pip install fonttools

然后,我们编写代码,读取字体库中的所有字体:

from fontTools.ttLib import TTFont
font = TTFont('方正静蕾体.ttf')
unicode_map = font['cmap'].tables[0].ttFont.getBestCmap()

这段代码获取的 unicode_map是一个字典,字典的 key 是这个字体库中所有字符的 unicode 码。所以,如果我们要检查某个汉字在不在这个字体库中,只需要检查汉字的 unicode 码在不在unicode_map中即可:

words = '一二龍三四'
for word in words:
    if ord(word) in unicode_map:
        print(f'字体库中有:【{word}】这个汉字')
    else:
        print(f'字体库没有:【{word}】这个汉字')

运行效果如下图所示:

对于守规矩的字体,这样写就足够了。但是有一些字体,他们明明没有某个汉字,却非要把这个汉字的 unicode 码添加到 unicode_map中,所以我们还可以再进一步检验:

glyf_map = font['glyf']
if len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) == 0:
            print(f'字符:【{word}】确实不在字体库中')

完整的代码如下图所示:

from fontTools.ttLib import TTFont
font = TTFont('方正静蕾体.ttf')
unicode_map = font['cmap'].tables[0].ttFont.getBestCmap()
glyf_map = font['glyf']
words = '一二龍三四'
for word in words:
    if ord(word) in unicode_map and len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) > 0:
        print(f'字体库中有:【{word}】这个汉字')
        continue
    print(f'字体库没有:【{word}】这个汉字')
目录
相关文章
用word快速将数字字体换成新罗马详细简单方法
用word快速将数字字体换成新罗马详细简单方法
3926 0
用word快速将数字字体换成新罗马详细简单方法
|
3月前
|
前端开发 JavaScript 安全
前端JS实现密码校验键盘横竖、26字母、相同字母、相同数字、密码包含用户名、数字 字母不能连续 不能相同三个、不能横向 竖向 连续三个 包含字符、不能有中文符号
该 JavaScript 代码实现了一个严格的密码校验功能,确保密码满足多种安全要求,包括长度、字符类型、不包含中文及特殊字符、不与用户名相似等。通过多个辅助函数,如 `validateFormat` 检查密码格式,`isHasChinaCharFun` 检测中文符号,`getCharAll` 生成键盘组合,以及 `checkPasswordFun` 综合验证密码的有效性和安全性。此工具对于提高用户账户的安全性非常有用。
93 0
|
6月前
|
JavaScript
js 判断字符串是否包含中文,判断字符串是否全是中文,判断字符是否为中文
js 判断字符串是否包含中文,判断字符串是否全是中文,判断字符是否为中文
275 0
|
8月前
Excel表格文件行与列均用数字而非字母表示的方法
Excel表格文件行与列均用数字而非字母表示的方法
109 1
|
SQL JSON 算法
如何快速检测是否空白字符
在Parser场景,包括SQL Parser和JSON Parser,如果更快检测空白字符时一个提升性能的关键点。笔者有多年SQL Parser和JSON Parser的经验,把我所知道的一些检测空白的方法分享给大家。 ## 1. 什么是空白字符 如果采用json.org的标准,空白字符包括: ```bash '\b' -- ASCII 8 '\t' -- ASCII 9 '\n' -- ASC
如何快速检测是否空白字符
|
移动开发 Windows
ES6字符串模板多行清除行头空格制表符
最近在撸项目工程化的时侯,需要输出一些文案提示, 对于多行文本我肯定优先考虑用 ES6字符串模板来实现,直接使用的效果并不是很符合想要的。 因为字符串模板会默认保留你换行的格式,包括缩进这些。
371 0
|
C#
实现:C#窗体中的文本框只能输入中文汉字,其他输入无效。问:正则表达式怎么用?
原文:实现:C#窗体中的文本框只能输入中文汉字,其他输入无效。问:正则表达式怎么用? private void textBox1_KeyPress(object sender, KeyPressEventArgs e...
1562 0
|
容器
第125天:移动端-空白字符问题解决办法
1、当我们想使用百分比来进行两个盒子的并排 代码: 1 DOCTYPE html> 2 3 4 5 6 html, 7 body { 8 margin: 0; 9 padding: 0; 10 } 11 12 .
1079 0

热门文章

最新文章