一日一技:如何判断某个汉字是不是在字体库中

简介: 一日一技:如何判断某个汉字是不是在字体库中

摄影:产品经理下厨:kingname

我们喜欢从网上下载各种各样的中文字体,但这些字体一般只设计了常用汉字,遇到生僻字时就会变成系统默认字体。如下图所示为方正静蕾简体,没有“龍鑨”两个汉字:

现在,我手上有10000个汉字,我如何快速确定哪些汉字在这个字体库中呢?

为了解决这个问题,我们需要安装 Python 的一个第三方库:fontTools

首先我们来安装它:

python3 -m pip install fonttools

然后,我们编写代码,读取字体库中的所有字体:

from fontTools.ttLib import TTFont
font = TTFont('方正静蕾体.ttf')
unicode_map = font['cmap'].tables[0].ttFont.getBestCmap()

这段代码获取的 unicode_map是一个字典,字典的 key 是这个字体库中所有字符的 unicode 码。所以,如果我们要检查某个汉字在不在这个字体库中,只需要检查汉字的 unicode 码在不在unicode_map中即可:

words = '一二龍三四'
for word in words:
    if ord(word) in unicode_map:
        print(f'字体库中有:【{word}】这个汉字')
    else:
        print(f'字体库没有:【{word}】这个汉字')

运行效果如下图所示:

对于守规矩的字体,这样写就足够了。但是有一些字体,他们明明没有某个汉字,却非要把这个汉字的 unicode 码添加到 unicode_map中,所以我们还可以再进一步检验:

glyf_map = font['glyf']
if len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) == 0:
            print(f'字符:【{word}】确实不在字体库中')

完整的代码如下图所示:

from fontTools.ttLib import TTFont
font = TTFont('方正静蕾体.ttf')
unicode_map = font['cmap'].tables[0].ttFont.getBestCmap()
glyf_map = font['glyf']
words = '一二龍三四'
for word in words:
    if ord(word) in unicode_map and len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) > 0:
        print(f'字体库中有:【{word}】这个汉字')
        continue
    print(f'字体库没有:【{word}】这个汉字')
目录
相关文章
用word快速将数字字体换成新罗马详细简单方法
用word快速将数字字体换成新罗马详细简单方法
3507 0
用word快速将数字字体换成新罗马详细简单方法
|
11月前
|
Windows
ArcMap属性表汉字乱码的一种解决方法
本文介绍ArcMap软件打开图层的属性表后,出现字段中汉字乱码情况的解决方法~
246 1
ArcMap属性表汉字乱码的一种解决方法
|
存储 Unix 开发工具
[oeasy]python0111_字型码_字符字型编码_点阵字库_ascii演化
[oeasy]python0111_字型码_字符字型编码_点阵字库_ascii演化
134 0
 [oeasy]python0111_字型码_字符字型编码_点阵字库_ascii演化
|
前端开发 程序员
小细节:盒模型里面连续输入英文和数字不会自动换行,汉字会自动换行
小细节:盒模型里面连续输入英文和数字不会自动换行,汉字会自动换行
63 0
运行可用:使用FreeType输出中文汉字点阵图形的源码
运行可用:使用FreeType输出中文汉字点阵图形的源码
174 0
运行可用:使用FreeType输出中文汉字点阵图形的源码
HTML颜色码对照表-英文代码、中文描述、十六进制、rgb值
HTML颜色码对照表-英文代码、中文描述、十六进制、rgb值
166 0
HTML颜色码对照表-英文代码、中文描述、十六进制、rgb值
|
编解码
Debug栏打印时自动把Unicode编码转化成汉字
Debug栏打印时自动把Unicode编码转化成汉字
126 0
Debug栏打印时自动把Unicode编码转化成汉字
|
C#
实现:C#窗体中的文本框只能输入中文汉字,其他输入无效。问:正则表达式怎么用?
原文:实现:C#窗体中的文本框只能输入中文汉字,其他输入无效。问:正则表达式怎么用? private void textBox1_KeyPress(object sender, KeyPressEventArgs e...
1486 0
|
容器
第125天:移动端-空白字符问题解决办法
1、当我们想使用百分比来进行两个盒子的并排 代码: 1 DOCTYPE html> 2 3 4 5 6 html, 7 body { 8 margin: 0; 9 padding: 0; 10 } 11 12 .
1037 0