
【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取
什么是基于深度学习的文本信息抽取? **信息抽取 (Information Extraction)** 是把原始数据中包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始数据,输出的是固定格式的信息点,即从原始数据当中抽取有用的信息。信息抽取的主要任务是将各种各样的信息点从原始数据中抽取出来。然后以统一的形式集成在一起,方便后序的检索和比较。由于能从自然语言中抽取出信息框架和用户感兴趣的事实信息,无论是在信息检索、问答系统还是在情感分析、文本挖掘中,信息抽取都有广泛应用。随着深度学习在自然语言处理领域的很多方向取得了巨大成功......
【图像分割】基于布谷鸟算法实现二维Tsallis熵、kapur、oust多阈值图像分割附matlab代码
【图像分割】基于布谷鸟算法实现二维Tsallis熵、kapur、oust多阈值图像分割附matlab代码

大规模图像识别场景中的实体存储与检索
背景图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图片识别功能基于图片AI技术,能够检测图片标签和置信度。 当前图片识别分析出的数据越来越丰富,随着实体信息(含原始数据及处理后的结构化元数据信息)的不断膨胀也带来了更多挑战。首先,如何弹性存储无限增长的海量数据并保证数据不丢不错。其次,信息存储后如何进行后续数据管控分析,如何从多个维度对外提供服务。这些对

Postman调用阿里云云市场的通用文字识别接口
购买了阿里云云市场的接口后,会提供两种接口认证方式:简单身份认证(AppCode)和签名认证,因签名认证相对复杂,可以参考之前的文章,本篇文章简单介绍在postman中通过AppCode调用阿里云云市场的通用文字识别接口

CV之MobiLenet:基于openpose利用CMU/MobilenetV2算法实现对多人体姿态(2019湖人勒布朗詹姆斯扣篮)实时估计检测
CV之MobiLenet:基于openpose利用CMU/MobilenetV2算法实现对多人体姿态(2019湖人勒布朗詹姆斯扣篮)实时估计检测

CV之NoGAN:利用图像增强技术(图片上色)实现对旧图像和电影片段进行着色和修复(爱因斯坦、鲁迅旧照/清末官员生活场景等案例)
CV之NoGAN:利用图像增强技术(图片上色)实现对旧图像和电影片段进行着色和修复(爱因斯坦、鲁迅旧照/清末官员生活场景等案例)

AI开发者大会之计算机视觉技术实践与应用:2020年7月3日《如何利用计算机视觉增加便利店连锁每日销售额》、《基于图像 / 视频的人脸和人体分析基础技术及其应用介绍》
AI开发者大会之计算机视觉技术实践与应用:2020年7月3日《如何利用计算机视觉增加便利店连锁每日销售额》、《基于图像 / 视频的人脸和人体分析基础技术及其应用介绍》

深度学习与CV教程(14) | 图像分割 (FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)
本文讲解了图像分割常见应用,评估指标,典型语义分割算法(FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)等【对应 CS231n Lecture 11】

Python使用EasyOCR库对行程码图片进行OCR文字识别介绍与实践
Python项目实践,图像处理之使用EasyOCR库对行程码图片进行批量OCR文字识别,以及使用OpenCV对行程码图片主体颜色识别,并且使用Flask框架以JSON格式返回相关信息,便于写入数据库之中,解决手工统计行程码图片效率低下问题,方便我们快速统计行程码相关信息,此处供有需要的同学一起学习,希望各位看友【关注、点赞、评论、收藏、投币】,助力每一个梦想。本视频内容以及EasyOCR 安装使用介绍可以参考我的B站专栏或者我个人博客。
图像分割以及语义分割技术研究现状
图像语义分割是当前机器视觉领域中的一个重要研究分支。近年,结合深度卷积神经网络的图像语义分割开始成为研究者们的研究重点,但是随着研究的深入,基于深度卷积神经网络的分割算法逐渐暴露出漏分割图像中的目标,分割结果不够精细等问题。

Python opencv图像处理基础总结(七) 基于分水岭算法的图像分割
任何一副灰度图像都可以被看成拓扑平面,灰度值高的区域可以被看成是山峰,灰度值低的区域可以被看成是山谷。我们向每一个山谷中灌不同颜色的水。随着水的位的升高,不同山谷的水就会相遇汇合,为了防止不同山谷的水汇合,我们需要在水汇合的地方构建起堤坝。不停地灌水,不停地构建堤坝知道所有的山峰都被水淹没。我们构建好的堤坝就是对图像的分割