深度学习与CV教程(14) | 图像分割 (FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)
本文讲解了图像分割常见应用,评估指标,典型语义分割算法(FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)等【对应 CS231n Lecture 11】
Python使用EasyOCR库对行程码图片进行OCR文字识别介绍与实践
Python项目实践,图像处理之使用EasyOCR库对行程码图片进行批量OCR文字识别,以及使用OpenCV对行程码图片主体颜色识别,并且使用Flask框架以JSON格式返回相关信息,便于写入数据库之中,解决手工统计行程码图片效率低下问题,方便我们快速统计行程码相关信息,此处供有需要的同学一起学习,希望各位看友【关注、点赞、评论、收藏、投币】,助力每一个梦想。本视频内容以及EasyOCR 安装使用介绍可以参考我的B站专栏或者我个人博客。
图像分割以及语义分割技术研究现状
图像语义分割是当前机器视觉领域中的一个重要研究分支。近年,结合深度卷积神经网络的图像语义分割开始成为研究者们的研究重点,但是随着研究的深入,基于深度卷积神经网络的分割算法逐渐暴露出漏分割图像中的目标,分割结果不够精细等问题。
Python opencv图像处理基础总结(七) 基于分水岭算法的图像分割
任何一副灰度图像都可以被看成拓扑平面,灰度值高的区域可以被看成是山峰,灰度值低的区域可以被看成是山谷。我们向每一个山谷中灌不同颜色的水。随着水的位的升高,不同山谷的水就会相遇汇合,为了防止不同山谷的水汇合,我们需要在水汇合的地方构建起堤坝。不停地灌水,不停地构建堤坝知道所有的山峰都被水淹没。我们构建好的堤坝就是对图像的分割
Opencv(二)—图像分割之分水岭算法
做图像处理时,我们可能会遇到一个问题:我们只需要图片的一部分区域,如何把图片中的某部分区域提取出来 或者 图像想要的区域用某种颜色(与其它区域颜色不一致)标记起来 ,以上描述的问题在像处理领域称为 图像分割
ITK 基础(二) — 图像分割 General Threshold
上篇文章介绍了 ITK 中的二值化分割,最终得到的是 二值图像(图像中只有两种像素值) 但有时我们会遇到另外一种需求,只改变某一阈值范围的像素值,其他部分保留;这时二值化分割已经满足不了我们的基本需求了,需要寻求另外一种方法。 本篇教程介绍 ITK 中的 General Threshold ,是二值化的改进版,可以只改变某一范围内的像素值,并且其它范围内像素值得到保留。
ThinkPHP6.0 实现 图片审核+文本内容审核(敏感词过滤)
应用场景 用户评论过滤:对网站用户的评论信息进行检测,审核出涉及违规内容,保证良好的用户体验 注册信息筛查:对用户的注册信息进行筛查,避免黑产通过用户名实现违规信息的推广 文章内容审核:对UGC文章内容进行多个维度的审核,避免因内容违规导致的APP下架等损失
阿里云智能视觉生产图像处理裁剪/尺寸变换Python SDK使用说明
裁剪/尺寸变换用于对输入的图片进行指定尺寸变换,自动判断主体区域位置,使用最佳的裁剪方式完成裁剪。本文介绍如何使用阿里云智能视觉生产图像处理裁剪/尺寸变换Python SDK,包括SDK的安装方法及SDK代码示例。
ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别
这篇论文旨在以极低的计算成本解决性能大幅下降的问题。提出了微分解卷积,将卷积矩阵分解为低秩矩阵,将稀疏连接整合到卷积中。提出了一个新的动态激活函数-- Dynamic Shift Max,通过最大化输入特征图与其循环通道移位之间的多个动态融合来改善非线性。
文字识别OCR开源框架的对比--Tesseract vs EasyOCR
OCR文字识别在目前有着比较好的应用,也出现了很多的文字识别软件,但软件是面向用户的。对于我们技术人员来说,有时难免需要在计算机视觉任务中加入文字识别,如车牌号识别,票据识别等,因此软件对我们是没用的,我们需要自己实现文字识别。
基于图像识别的启发式UI自动化测试介绍
使用图像识别技术进行客户端游戏自动化是一种比较通用快捷的做法,是一种不依赖游戏客户端的外部自动化操作。在结合方便的脚本编辑工具后,使得这种自动化测试方式和按键精灵一样门槛极低。 将游戏客户端屏幕内容进行截图。在windows平台需要调用系统获取屏幕内容API进行屏幕画面保存。在Android平台可以调用adb命名进行截图保存。
机器学习(五)聚类之图像分割
灰度、颜色、纹理、形状等特征,把图像分成若干个互不重叠的区域,并使这些特征在同一区域内呈现相似性,在不同的区域之间存在明显的差异性。然后就可以将分割的图像中具有独特
阿里云文字识别(OCR)个人证照识别-身份证识别产品说明
阿里云读光通用识别类OCR识别产品,可将各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式进行文本识别和还原。为了能够更好的还原文字信息和文档结构,读光文档识别在通用全文识别能力(文字定位、行分析、文字识别)的基础上,增加了文档结构的版面分析和文档图像处理能力,使得文档类图像也能按照结构化的方式进行文档元素提取,进一步提升文档识别的产品体验。本文着重介绍个人证照识别-身份证识别产品各参数说明。
阿里云文字识别(OCR)通用文字识别-全文识别高精版产品说明
阿里云读光通用识别类OCR识别产品,可将各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式进行文本识别和还原。为了能够更好的还原文字信息和文档结构,读光文档识别在通用全文识别能力(文字定位、行分析、文字识别)的基础上,增加了文档结构的版面分析和文档图像处理能力,使得文档类图像也能按照结构化的方式进行文档元素提取,进一步提升文档识别的产品体验。本文着重介绍通用文字识别-全文识别高精版产品各参数说明。
【动手学计算机视觉】第三讲:图像预处理之图像分割
图像分割是一种把图像分成若干个独立子区域的技术和过程。在图像的研究和应用中,很多时候我们关注的仅是图像中的目标或前景(其他部分称为背景),它们对应图像中特定的、具有独特性质的区域。为了分割目标,需要将这些区域分离提取出来,在此基础上才有可能进一步利用,如进行特征提取、目标识别。因此,图像分割是由图像处理进到图像分析的关键步骤,在图像领域占据着至关重要的地位。
【动手学计算机视觉】第二讲:图像预处理之图像增强
计算机视觉主要有两部分组成: 特征提取 模型训练 其中第一条特征提取在计算机视觉中占据着至关重要的位置,尤其是在传统的计算机视觉算法中,更为明显,例如比较著名的HOG、DPM等目标识别模型,主要的研究经历都是在图像特征提取方面。图像增强能够有效的增强图像中有价值的信息,改善图像质量,能够满足一些特征分析的需求,因此,可以用于计算机视觉数据预处理中,能够有效的改善图像的质量,进而提升目标识别的精度。
阿里云智能视觉生产图像处理裁剪/尺寸变换Java SDK使用说明
裁剪/尺寸变换用于对输入的图片进行指定尺寸变换,自动判断主体区域位置,使用最佳的裁剪方式完成裁剪。本文介绍如何使用阿里云智能视觉生产图像处理裁剪/尺寸变换Java SDK,包括SDK的安装方法及SDK代码示例。
阿里云内容安全java SDK实现本土图片审核
内容安全是一款多媒体内容智能识别服务,支持对图片、视频、文本、语音等对象进行多样化场景检测,帮助您有效降低内容违规风险。 此篇文章将简单介绍通过javasdk实现本地图片的安全检测
阿里云智能视觉生产图像分析色板分析Java SDK使用说明
色板分析用于对输入图的颜色信息进行分析,给出颜色值(RGB形式和HEX格式)与对应的占比信息。本文介绍如何使用阿里云智能视觉生产图像分析色板分析Java SDK,包括SDK的安装方法及SDK代码示例。
阿里云智能视觉生产图像分析元素识别定位Java SDK使用说明
元素识别定位用于识别输入图中所包含的元素,用矩形框标注出其位置,并区分其对应的基本类型(人/物、修饰、文案)。本文介绍如何使用阿里云智能视觉生产图像分析元素识别定位Java SDK,包括SDK的安装方法及SDK代码示例。