现在在我们的生活中二维码是很常见的一个东西了,二维码加微信、二维码付款、二维码地址跳转,.......等等,可以说二维码随处可见。
那么二维码是如何生成的呢?它的原理又是什么?今天就来说说如何实用python来生成二维码。最后源码还是会上传至github,欢迎下载使用。
首先我们先简单的说说二维码的原理。除了二维码,我们在购买东西的时候,收银员都会拿机器扫一下商品上面的一个码,然后就能知道这个商品的信息:商品名称、价格等等,这个码是条形码。
条形码其实就是一维的数据,当机器在水平方向上扫码这些粗细不同的黑白条时能够获取到其中的数据信息。而相比于只在一个维度上携带信息的条形码,二维码在水平、垂直两个维度上都携带了数据,所以二维码比条形码有着更高的数据存储容量,能存更多的信息,也能表示更多的数据类型:比如:字符,数字,日文,中文等等。
通俗点说条形码和二维码都是一种编码方式,都是对一些数字、字母、字符等人们共识的常规文字,转换成另外一种相对应的符号(黑白条、黑白方块),然后又让这些符号能够被机器识别和翻译成为常规文字。
前面说到二维码其实就是一种编码方式,所以这里有个很重要的点,那就是二进制编码。二进制由0和1组成,它可以将数字、字母等字符转换成由0和1组成的数字集合,二进制的过程也被称为编码过程。
比如,如果将百度的网址 “www.baidu.com ” 转换成二进制后如下所示:
01110111011101110111011100101110011000100110000101101001011001000111010100101110011000110110111101101101 复制代码
我们知道二维码其实是由很多的黑色、白色的区域块组成的。所以如果我们定义0是黑色,1是白色的话。那么上面的二进制就是黑白白白黑.......。然后如果再将这些黑白块通过某种排序方式塞进一个指定大小的正方形的区域里,那就是一个二维码的雏形了。
但是数据编码的方式有很多,如Numeric mode数字编码;Byte mode,字节编码;Alphanumeric mode 字符编码;Kanji mode 这是日文编码,也是双字节编码;Extended Channel Interpretation (ECI) mode 主要用于特殊的字符集。并不是所有的扫描器都支持这种编码;Structured Append mode 用于混合编码,也就是说,这个二维码中包含了多种编码格式。
每一个编码方式都有其独有的id进行标识,这些标识会记录在数据区的前端,使得解码器可以根据二维码使用的编码方式对数据进行解码。
另外在二维码中有几个重要的参数:
version:值为1~40的整数,控制二维码的大小(最小值是1,是个12×12的矩阵)。如果想让程序自动确定,将值设置为 None 并使用 fit 参数即可。 error_correction:控制二维码的错误纠正功能。可取值下列4个常量。
1、ERROR_CORRECT_L:大约7%或更少的错误能被纠正。
2、ERROR_CORRECT_M(默认):大约15%或更少的错误能被纠正。
3、ROR_CORRECT_H:大约30%或更少的错误能被纠正。
4、box_size:控制二维码中每个小格子包含的像素数。 border:控制边框(二维码与图片边界的距离)包含的格子数(默认为4,是相关标准规定的最小值)。 img.save:是将生成二维码图片保存到哪里。
二维码对应的功能区域如下图所示(图源网络,侵删):
A:功能图形区:起到定位的作用
a:定位图形
由两条黑白相间的直线组成,便于确定二维码的角度,纠正扭曲。
b:校正图形
仅在版本2以上存在,由三个黑白相间的小正方形嵌套组成,便于确定中心,纠正扭曲。
c:位置探测图形
由三个黑白相间的大正方形嵌套组成,分别位于二维码左上角、右上角、左下角,目的是为了确定二维码的大小和位置。
B:数据编码区:记录了具体的数据信息,纠错信息与版本信息。
d:数据码和纠错码
数据码(Data Code ):存储要存放的数据信息
纠错码(Error Correction Code ):纠错码的存在使得当二维码的数据出现允许范围内的错误时,也可以正确解码。这就是为什么二维码有残缺还能扫出来,也就是为什么有人在二维码的中心位置加入图标。二维码存在4个级别的纠错等级,每个纠错级别可修正的错误与标识见图4,纠错级别越高,可以修正的错误就越多,需要的纠错码的数量也变多,相应的可储存的数据就会减少,版本1的二维码在L级别下可储存25个字符,在H级别下只能储存10个字符。
e:版本信息
仅在版本7以上存在,记录具体的版本信息。
f:格式信息
记录使用的掩码和纠错等级。
g:数据编码
不在详述,见编码规则
C:此外二维码的外围还留有一圈空白区:主要是为了便于识别而存在。
二维码如何进行编码、排序、存储等优化算法、定位算法、功能性数据、纠错码、掩码等等涉及到的底层原理比较多,这里一篇文章很难说清楚,所以后面文章会单独说明,这里我们需要明白的是:
二维码的原理可以简单总结为:将我们想要存储的信息,通过不同的编码格式转换为二进制字符串,字符在变成0和1组成的序列之后,再进行一系列优化算法,就得到了最终的二进制编码.1对应黑色小方块,0对应白色小方块,然后将这些小方块八个一组填进大方块里.就变成了大家看到的二维码了。
对于二维码的底层原理如果并不理解其实不是很重要,这些并不影响我们使用二维码,因为很多的编程语言都对封装了二维码的包和库,我们只要知道了这些库的原理直接使用就可以生成我们想使用的二维码了。
接下来我们使用python来生成二维码。
首先我们需要导入myqr库:
pip install myqr 复制代码
pip install myqr -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 复制代码
这时候我们就已经能够生成二维码了。比如生成一个打开百度的二维码:
# 先导入库 from MyQR import myqr myqr.run( # word就是要生成二维码的信息 words='http://baidu.com', ) 复制代码
运行后我们会看到在项目文件夹下生成一个qrcode.png的文件:
打开具体二维码如下,扫描即可打开百度网页:
除此之外还可以自定义更多样式的二维码,比如生成一个属于你的带有logo图案的彩色的二维码:
from MyQR import myqr myqr.run( words='https://baidu.com', picture='.\\gzh.png', colorized=True, save_name='002.png', ) 复制代码
myqr.run()方法还有很多参数,结合这些参数的值我们可以自定义更多多样化的二维码,图源自百度经验:
代码:
from MyQR import myqr myqr.run( # 扫描二维码后,显示的内容,或是跳转的链接 words='网址链接或者字符串,不支持中文', # 设置容错率 version=5, # 控制纠错水平,范围是L、M、Q、H,从左到右依次升高 level='H', # 设置背景图片 picture='7cf0bfb0bb10ea94d19455a13f62a05.png', # 设置二维码颜色:黑白(False)还是彩色(True) colorized=True, # 用以调节图片的对比度,1.0 表示原始图片。默认为1.0。 contrast=1.0, # 用来调节图片的亮度,用法同上。 brightness=1.0, # 控制输出文件名 save_name='7cfaa.png', # 图片存储位置 save_dir=r'C:\Users', ) 复制代码
上面就是二维码的原理以及如何使用python生成一个属于自己的第一个二维码,感兴趣的同学可以自己试试,有任何问题欢迎交流讨论。