图像中二维码的检测和定位

2022-05-10 1383

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 图像中二维码的检测和定位

二维码

二维条码/二维码（2-dimensional bar code）是用某种特定的几何图形按一定规律在平面（二维方向上）分布的黑白相间的图形记录数据符号信息的；在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念，使用若干个与二进制相对应的几何形体来表示文字数值信息，通过图象输入设备或光电扫描设备自动识读以实现信息自动处理：它具有条码技术的一些共性：每种码制有其特定的字符集；每个字符占有一定的宽度；具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形旋转变化点。

QR-Code-Overview.jpeg

定位图案

Position Detection Pattern是定位图案，用于标记二维码的矩形大小。这三个定位图案有白边叫Separators for Postion Detection Patterns。之所以三个而不是四个意思就是三个就可以标识一个矩形了。
Timing Patterns也是用于定位的。原因是二维码有40种尺寸，尺寸过大了后需要有根标准线，不然扫描的时候可能会扫歪了。
Alignment Patterns 只有Version 2以上（包括Version2）的二维码需要这个东东，同样是为了定位用的。

通过查找定位图案，可以实现二维码扫描的检测和定位。

检测和定位的步骤

先对图片进行灰度处理：

image = image.getImage().convert2Gray().getProcessor();
ByteProcessor src = ((ByteProcessor)image);

再对图像做二值化处理：

Threshold t = new Threshold();
t.process(src, Threshold.THRESH_OTSU, Threshold.METHOD_THRESH_BINARY_INV, 20);

然后是对y、x方向进行形态学上的开操作

MorphOpen mOpen = new MorphOpen();
        byte[] data = new byte[width*height];
        System.arraycopy(src.getGray(), 0, data, 0, data.length);
        ByteProcessor copy = new ByteProcessor(data, width, height);
        mOpen.process(src, new Size(n1, n2)); // Y方向开操作
        src.getImage().resetBitmap();
        mOpen.process(copy, new Size(n2, n1)); // X方向开操作
        CV4JImage cv4JImage = new CV4JImage(width,height);
        ((ByteProcessor)cv4JImage.getProcessor()).putGray(copy.getGray());

所谓开操作是指先腐蚀后膨胀的操作。在之前的文章二值图像分析:案例实战(文本分离+硬币计数)曾经介绍过开操作的用途。

import com.cv4j.core.datamodel.ByteProcessor;
import com.cv4j.core.datamodel.Size;
public class MorphOpen {
    /**
     * in order to remove litter noise block, erode + dilate operator
     *
     * @param binary
     * @param structureElement
     */
    public void process(ByteProcessor binary, Size structureElement) {
        FastErode erode = new FastErode();
        FastDilate dilate = new FastDilate();
        erode.process(binary, structureElement, 1);
        dilate.process(binary, structureElement, 1);
    }
}

接下来是标记联通区域，找到二维码的三个特征区域，也就是定位图案。

// 联通组件查找连接区域
        ConnectedAreaLabel ccal = new ConnectedAreaLabel();
        ccal.setFilterNoise(true);
        List<Rect> rectList = new ArrayList<>();
        int[] labelMask = new int[width*height];
        ccal.process(src, labelMask, rectList, true);
        float w = 0;
        float h = 0;
        float rate = 0;
        List<Rect> qrRects = new ArrayList<>();
        for(Rect roi : rectList) {
            if (roi == null) continue;
            if((roi.width > width/4 || roi .width < 10) || (roi.height < 10 || roi.height > height/4))
                continue;
            if((roi.x < 10 || roi.x > width -10)|| (roi.y < 10 || roi.y > height-10))
                continue;
            w = roi.width;
            h = roi.height;
            rate = (float)Math.abs(w / h  - 1.0);
            if(rate < 0.05 && isRect(roi, labelMask, width, height,true)) {
                qrRects.add(roi);
            }
        }

最后，通过定位图案能够找到二维码所在的区域，如果找不到会返回空的矩形。否则返回一个Rect，它表示找到的二维码所在图像中的区域。

我们可以对该区域进行标识，下面是算法的具体使用，找到图像中的二维码之后，用红色的边框框起来。

CV4JImage cv4JImage = new CV4JImage(bitmap);
        QRCodeScanner qrCodeScanner = new QRCodeScanner();
        Rect rect = qrCodeScanner.findQRCodeBounding(cv4JImage.getProcessor(),1,6);
        Bitmap bm = bitmap.copy(Bitmap.Config.ARGB_8888, true);
        Canvas canvas = new Canvas(bm);
        Paint paint = new Paint();
        paint.setColor(Color.RED);
        paint.setStrokeWidth((float) 10.0);
        paint.setStyle(Paint.Style.STROKE);
        android.graphics.Rect androidRect = new android.graphics.Rect(rect.x-20,rect.y-20,rect.br().x+20,rect.br().y+20);
        canvas.drawRect(androidRect,paint);
        image.setImageBitmap(bm);

定位图片中的二维码区域.png

定位有创意的二维码.png

截图微信的二维码.png

对于iPhone截屏之后的图片，该图片尺寸是1242 × 2208。在没有对图片做任何缩放处理的情况下，使用该算法进行定位二维码的区域也是ok的。

大图中的二维码.png

当然，对于大图如果适当地降采样处理或者缩放的话，算法速度会更快。

写在最后

彩色二维码和小程序的圆形二维码目前能够检测吗？

暂时不能。因为图像在二值化之后，彩色的部分像素点会变成白色的像素点，导致二维码轮廓不完整，最终导致无法实现二值分析。我们会在完成模版匹配的功能之后，继续优化算法完善该功能，加上检测彩色和圆形二维码的能力。

算法的源码位于cv4j的QRCodeScanner中，该算法不能识别二维码的字符串，只能找到二维码的区域，如果需要识别二维码还是需要使用Google Zxing。

总结

cv4j 是gloomyfish和我一起开发的图像处理库，纯java实现，目前还处于早期的版本。

文章中的算法是对二值图像分析的综合运用，使用它再结合Google的ZXing能够提高二维码的识别率。当然，由于它是pure java实现的，稍作改动能够用它来判断出某张图片中是否包含有二维码。

图像中二维码的检测和定位

二维码

检测和定位的步骤

写在最后

总结

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

图像中二维码的检测和定位

二维码

检测和定位的步骤

写在最后

总结

热门文章

最新文章

相关电子书