二值图像分析:案例实战(文本分离+硬币计数)

简介: 二值图像分析:案例实战(文本分离+硬币计数)

图像的二值化



图像二值化就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。

将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中,二值图像占有非常重要的地位,首先,图像的二值化有利于图像的进一步处理,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。其次,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像。


在实际应用中,很多图像的分析最终都转换为二值图像的分析,比如:医学图像分析、前景检测、字符识别,形状识别。二值化+数学形态学能解决很多计算机识别工程中目标提取的问题。


开操作演示---文本分离与切割



开操作是先腐蚀后膨胀的过程。用来消除小物体、在纤细点处分离物体、平滑较大物体的边界的同时并不明显改变其面积。


跟开操作相对应的是闭操作。另外,腐蚀和膨胀在下文中有介绍。


cv4j 中,我们封装好了这些形态学的常用操作,比如开闭操作、腐蚀和膨胀等等。


其中,开操作的代码如下:

public class MorphOpen {
    /**
     * in order to remove litter noise block, erode + dilate operator
     *
     * @param binary
     * @param structureElement
     */
    public void process(ByteProcessor binary, Size structureElement) {
        Erode erode = new Erode();
        Dilate dilate = new Dilate();
        erode.process(binary, structureElement);
        dilate.process(binary, structureElement);
    }
}


先来看一个完整demo的效果图


image.png

完整的demo效果.png


第三步如果看不太清楚,我们看一下放大的效果图


image.png

放大第三步的操作.png


如上图所示,demo完成了文本的切割。我们来看看具体的代码是怎么实现的。

准备工作展示原图

Resources res = getResources();
        final Bitmap bitmap = BitmapFactory.decodeResource(res, R.drawable.test_binary1);
        image0.setImageBitmap(bitmap);


第一步二值化

CV4JImage cv4JImage = new CV4JImage(bitmap);
        Threshold threshold = new Threshold();
        threshold.process((ByteProcessor)(cv4JImage.convert2Gray().getProcessor()),Threshold.THRESH_TRIANGLE,Threshold.METHOD_THRESH_BINARY_INV,255);
        image1.setImageBitmap(cv4JImage.getProcessor().getImage().toBitmap());


第二步开操作

MorphOpen morphOpen = new MorphOpen();
cv4JImage.resetBitmap();
morphOpen.process((ByteProcessor)cv4JImage.getProcessor(),new Size(5));
image2.setImageBitmap(cv4JImage.getProcessor().getImage().toBitmap());


第三步连通组件标记

ConnectedAreaLabel connectedAreaLabel = new ConnectedAreaLabel();
        byte[] mask = new byte[cv4JImage.getProcessor().getWidth() * cv4JImage.getProcessor().getHeight()];
        List<Rect> rectangles = new ArrayList<>();
        connectedAreaLabel.process((ByteProcessor)cv4JImage.getProcessor(),mask,rectangles,true);
        cv4JImage.resetBitmap();
        Bitmap newBitmap = cv4JImage.getProcessor().getImage().toBitmap();
        if (Preconditions.isNotBlank(rectangles)) {
            Tools.drawRects(newBitmap,rectangles);
        }
        image3.setImageBitmap(newBitmap);


其实,做完第三步再结合ocr就可以识别出具体文字啦。如果再结合一下网络爬虫的话,意义更大。


虽然, cv4j 目前还只是移动端的库,但是它毕竟是java开发的,改成适合desktop的很容易。


腐蚀操作演示---硬币计数



腐蚀操作是一种消除边界点,使边界向内部收缩的过程。可以用来消除小且无意义的物体。腐蚀操作扫描图像的每一个像素,用结构元素与其覆盖的二值图像做“与”操作:如果都为1,结果图像的该像素为1,否则为0。


跟腐蚀操作相对的是膨胀操作。腐蚀用于分割独立的图像元素,而膨胀用于连接相邻的元素。


腐蚀的算法:


image.png

腐蚀操作.png


其中,g(x,y)为腐蚀后的灰度图像,f(x,y)为原灰度图像,B为结构元素。腐蚀运算是由结构元素确定的邻域块中选取图像值与结构元素值的差的最小值。

可以简化为:


image.png

简化的腐蚀操作.png


来看一个例子,原图中有很多硬币,通过一步步的分析计算出硬币的个数。


网络异常,图片无法展示
|

硬币计数1.png


网络异常,图片无法展示
|

硬币计数2.png


准备工作展示原图

Resources res = getResources();
        final Bitmap bitmap = BitmapFactory.decodeResource(res, R.drawable.test_coins);
        image0.setImageBitmap(bitmap);


第一步二值化

CV4JImage cv4JImage = new CV4JImage(bitmap);
        Threshold threshold = new Threshold();
        threshold.process((ByteProcessor)(cv4JImage.convert2Gray().getProcessor()),Threshold.THRESH_OTSU,Threshold.METHOD_THRESH_BINARY_INV,255);
        image1.setImageBitmap(cv4JImage.getProcessor().getImage().toBitmap());


第二步腐蚀操作

Erode erode = new Erode();
        cv4JImage.resetBitmap();
        erode.process((ByteProcessor)cv4JImage.getProcessor(),new Size(3),10);
        image2.setImageBitmap(cv4JImage.getProcessor().getImage().toBitmap());


第三步连通组件标记

ConnectedAreaLabel connectedAreaLabel = new ConnectedAreaLabel();
        byte[] mask = new byte[cv4JImage.getProcessor().getWidth() * cv4JImage.getProcessor().getHeight()];
        int num = connectedAreaLabel.process((ByteProcessor)cv4JImage.getProcessor(),mask,null,false); // 获取连通组件的个数
        SparseIntArray colors = new SparseIntArray();
        Random random = new Random();
        int height = cv4JImage.getProcessor().getHeight();
        int width = cv4JImage.getProcessor().getWidth();
        int size = height * width;
        for (int i = 0;i<size;i++) {
            int c = mask[i] & 0xff;
            colors.put(c,Color.argb(255, random.nextInt(255),random.nextInt(255),random.nextInt(255)));
        }
        cv4JImage.resetBitmap();
        Bitmap newBitmap = cv4JImage.getProcessor().getImage().toBitmap();
        for(int row=0; row<height; row++) {
            for (int col = 0; col < width; col++) {
                int c = mask[row*width+col] & 0xff;
                if (c>0) {
                    newBitmap.setPixel(col,row,colors.get(c));
                }
            }
        }
        image3.setImageBitmap(newBitmap);
        if (num>0)
            numTextView.setText(String.format("总计识别出%d个硬币",num));


最终获取了连通组件的个数也就是硬币的个数,并且在已经识别的硬币上随机着色。


总结



cv4jgloomyfish和我一起开发的图像处理库,纯java实现,目前还处于早期的版本。这周,我们开始做二值图像的分析(腐蚀、膨胀、开闭操作、轮廓提取等等),这个模块并没有完成全部功能,预计下周能完工。

相关文章
|
2月前
|
人工智能 搜索推荐
StableIdentity:可插入图像/视频/3D生成,单张图即可变成超人,可直接与ControlNet配合使用
【2月更文挑战第17天】StableIdentity:可插入图像/视频/3D生成,单张图即可变成超人,可直接与ControlNet配合使用
33 2
StableIdentity:可插入图像/视频/3D生成,单张图即可变成超人,可直接与ControlNet配合使用
|
2月前
|
存储 算法 索引
模拟算法题练习(二)(DNA序列修正、无尽的石头)
模拟算法题练习(二)(DNA序列修正、无尽的石头)
|
25天前
|
计算机视觉
图像处理之给定任意四点不规则放缩
图像处理之给定任意四点不规则放缩
15 3
|
2月前
|
存储 计算机视觉 Python
使用 ChatGPT 计算图片中包含的三角形的个数
使用 ChatGPT 计算图片中包含的三角形的个数
|
2月前
|
计算机视觉 异构计算 Python
YOLOv8改进 | 进阶实战篇 | 利用YOLOv8进行视频划定区域目标统计计数
YOLOv8改进 | 进阶实战篇 | 利用YOLOv8进行视频划定区域目标统计计数
163 0
|
2月前
|
监控
画图解释FHSS、DSSS扩频原理以及计算规则
画图解释FHSS、DSSS扩频原理以及计算规则
132 0
|
12月前
|
人工智能 自然语言处理 文字识别
理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度
理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度
150 0
射线法——判断一个点是否在多边形内部(适用于凸多边形和凹多边形)【关键原理解释+文字伪代码】
射线法——判断一个点是否在多边形内部(适用于凸多边形和凹多边形)【关键原理解释+文字伪代码】
438 0
|
Python
用Python语言对任意图像进行m*n的均匀分块(思路非常清晰,步骤简单)
用Python语言对任意图像进行m*n的均匀分块(思路非常清晰,步骤简单)
165 0
|
文字识别 算法 计算机视觉
【数图大作业】基于模板匹配的文字识别(一)(思路+实现要点+预处理分析)
【数图大作业】基于模板匹配的文字识别(一)(思路+实现要点+预处理分析)