摄影:产品经理下厨:kingname
我们喜欢从网上下载各种各样的中文字体,但这些字体一般只设计了常用汉字,遇到生僻字时就会变成系统默认字体。如下图所示为方正静蕾简体,没有“龍鑨”两个汉字:
现在,我手上有10000个汉字,我如何快速确定哪些汉字在这个字体库中呢?
为了解决这个问题,我们需要安装 Python 的一个第三方库:fontTools
首先我们来安装它:
python3 -m pip install fonttools
然后,我们编写代码,读取字体库中的所有字体:
from fontTools.ttLib import TTFont font = TTFont('方正静蕾体.ttf') unicode_map = font['cmap'].tables[0].ttFont.getBestCmap()
这段代码获取的 unicode_map
是一个字典,字典的 key 是这个字体库中所有字符的 unicode 码。所以,如果我们要检查某个汉字在不在这个字体库中,只需要检查汉字的 unicode 码在不在unicode_map
中即可:
words = '一二龍三四' for word in words: if ord(word) in unicode_map: print(f'字体库中有:【{word}】这个汉字') else: print(f'字体库没有:【{word}】这个汉字')
运行效果如下图所示:
对于守规矩的字体,这样写就足够了。但是有一些字体,他们明明没有某个汉字,却非要把这个汉字的 unicode 码添加到 unicode_map
中,所以我们还可以再进一步检验:
glyf_map = font['glyf'] if len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) == 0: print(f'字符:【{word}】确实不在字体库中')
完整的代码如下图所示:
from fontTools.ttLib import TTFont font = TTFont('方正静蕾体.ttf') unicode_map = font['cmap'].tables[0].ttFont.getBestCmap() glyf_map = font['glyf'] words = '一二龍三四' for word in words: if ord(word) in unicode_map and len(glyf_map[unicode_map[ord(word)]].getCoordinates(0)[0]) > 0: print(f'字体库中有:【{word}】这个汉字') continue print(f'字体库没有:【{word}】这个汉字')