前几个版本的代码, 虽然都可以解决问题, 但是有点麻烦, 如果是很多个文字, 也不能一个一个手敲上去, 更不能保证字体的顺序不变, 这次使用pillow + ddddocr来彻底解决这个问题
思路和过程在前几篇已经写过了, 有什么不明白的, 先看一下前几篇, 链接放在了最下面, 源码也在最下面
首先获取字体文件unicode_map, 取出字体的ascii值和字形的名称
然后使用pillow的 ImageFont 和 ImageDraw, 将字体转为图片, 尽量将字放在中间, 切在周围留有空白, 这样可以提高准确率
最后使用ddddocr来识别图片文字, 准确率非常高
将ttf文件字体转为图片如下, 可以人工对比一下是否正确
最后完善一下代码, 可以保存图片, 验证结果, 如果不存在字体文件会先下载, 然后再识别, 可以完美解决这个字体反爬, 其它网站相关的字体反爬, 也可以使用
完整代码后台回复 font_ddddocr_spider 获取
参考
https://blog.csdn.net/zjq592767809/article/details/122426907
https://blog.csdn.net/weixin_45304329/article/details/122408336
https://github.com/sml2h3/ddddocr
https://pillow.readthedocs.io/en/stable/reference/ImageFont.html