开发者社区> 视觉智能> 图像理解
725
分享

图像理解

+关注

图像识别技术可实现精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等,为用户提供图像打标、场景分类、颜色识别、风格识别以及元素识别等能力。图像识别技术可广泛应用于数字营销、新零售、广告设计等行业场景。

0
今日
129
内容
0
活动
24
关注

如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误

### 简介 【批量识别图片内容重命名】工具可批量识别图片中的文字并重命名文件,方便高效处理大量图片。然而,OCR 技术面临字符识别错误(如形近字混淆、生僻字识别不佳)、格式错误(段落错乱、换行问题)和语义理解错误等挑战。为提高准确性,建议提升图片质量、选择合适的 OCR 软件及参数,并结合自动校对与人工审核,确保最终文本的正确性和完整性。

158 12

YOLOv8优改系列一:YOLOv8融合BiFPN网络,实现网络快速涨点

该专栏专注于YOLOv8的 Neck 部分改进,融合了 BiFPN 网络,大幅提升检测性能。BiFPN 通过高效的双向跨尺度连接和加权特征融合,解决了传统 FPN 的单向信息流限制。文章详细介绍了 BiFPN 的原理及其实现方法,并提供了核心代码修改指导。点击链接订阅专栏,每周定时更新,助您快速提升模型效果。推荐指数:⭐️⭐️⭐️⭐️,涨点指数:⭐️⭐️⭐️⭐️。

351 0

如何使用深度学习实现图像分类

深度学习在图像分类中扮演着核心角色,通过卷积神经网络(CNN)自动提取图像特征并分类。本文介绍深度学习原理及其实现流程,包括数据准备、构建CNN模型、训练与评估模型,并讨论如何在阿里云上部署模型及其实用场景。

337 2

YOLOv5实现图片内目标检测

本文介绍了如何配置yolov5的运行环境、如何进行数据标注、如何通过yolov5训练数据集实现图片的目标检测。目标检测在计算机视觉领域中具有重要意义,yolov5(You Only Look One-level)是目标检测算法中的一种代表性方法,以其高效性和准确性备受关注,并且在各种目标检测任务中都表现出卓越的性能。

699 1

OpenVI-感知理解系列之GAP骨骼点动作识别 ICCV23顶会论文深入解读

本文介绍了ICCV23中稿论文 GAP: Generative Action Description Prompts for Skeleton-based Action Recognition

1087 2

【OpenCv • c++】图像识别边缘检测 图像差分运算

【OpenCv • c++】图像识别边缘检测 图像差分运算

403 0

超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(二)

超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(二)

348 0

超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(一)

超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(一)

295 0

基于PyTorch、易上手,细粒度图像识别深度学习工具库Hawkeye开源

基于PyTorch、易上手,细粒度图像识别深度学习工具库Hawkeye开源

373 0

解密阿里云智能图像识别服务(AIGC)的关键技术与应用

解密阿里云智能图像识别服务(AIGC)的关键技术与应用

817 1

基于图像识别的面瘫检测技术

图像识别是通过计算机对特定情况进行图像采集处理,分析匹配目标,提取特征,训练分类模型等步骤实现,在国内外科学家的努力下,实现了突飞猛进的变化,人们开始将这一技术应用于,医学,农业,安防,交通,车辆领域。在这一背景之下,许多先进的医疗手段都离不开图像识别技术的支持,小到日常的体检如胸片,心电图我们都可以通过自助取片获得计算机提供的初步诊断信息,之后再找医生问诊,大到一些微创手术,脑部ct技术,心脏病理分析,肺结核图像识别,糖尿病患者的视网膜图像技术

380 0

阿里云产品体系分为6大分类——人工智能——分为10种模块——图像识别

阿里云产品体系分为6大分类——人工智能——分为10种模块——图像识别自制脑图

173 1

Resnet图像识别入门——Softmax分类是如何工作的

softmax作为一个分类器,它只是把重要的信息变得更重要了而已。

578 0

Resnet图像识别入门——全连接

全连接,到底连接的是什么?看完这篇文章,相信你会有所了解。

454 0

Resnet图像识别入门——池化层

池化和卷积不同,它没有channel维度的累加。

895 0

Resnet图像识别入门——残差结构

残差结构像是Resnet的告诉公路,可以将计算误差很好的保留下来。

922 0

Resnet图像识别入门——初识卷积

卷积对于Resnet的重要性,不亚于反向传播算法对于深度学习的重要性。可以说,是灵魂。

361 0

Resnet图像识别入门—— 图像的色彩空间

了解 图像的色彩空间会让你对像素有更多的认识。

376 1

Resnet图像识别入门——像素

学习图像识别,最要了解的就是像素的属性和性质。

376 0

GitHub 首个开源图像识别系统又在搞事情!上

GitHub 首个开源图像识别系统又在搞事情!上

1317 0

基于darknet开发了一系列的快速启动脚本,旨在让图像识别新手或者开发人员能够快速的启动一个目标检测(定位)的项目

基于darknet开发了一系列的快速启动脚本,旨在让图像识别新手或者开发人员能够快速的启动一个目标检测(定位)的项目

355 0

【图像识别】基于卷积神经网络CNN和支持向量机SVM实现花卉图像识别附matlab代码

【图像识别】基于卷积神经网络CNN和支持向量机SVM实现花卉图像识别附matlab代码

472 0

图像识别之图片处理基础内容

Python call()方法, Python 类中一个非常特殊的实例方法,即 call()。该方法的功能类似于在类中重载 () 运算符,使得类实例对象可以像调用普通函数那样,以“对象名()”的形式使用。

419 0

NFNETS论文解读:不使用BN的高性能大规模图像识别

NFNETS论文解读:不使用BN的高性能大规模图像识别

203 0

人工智能,神经网络,图像识别,目标检测

该库采用C及C++ 语言编写,可以在windows,linux,macOSX系统上面运行。该库的所有代码都经过优化,计算效率很高 它的一个目标是提供友好的机器视觉接口函数,从而使得复杂的机器视觉产品可以加速面世。该库包含了横跨工业产品检测、医学图像处理、安防、用户界面、摄像头标定、三维成像、机器视觉等领域的超过500个接口函数。

266 0

一分钟学懂-图像识别的原理

关注我,学习更多简单易懂的编程实战案例。进主页获取更多编程/就业/副业/创业/资源。

378 0

应用开发图像识别之经典方法

花无从开日,人无再少年,加油!。 今天主要和大家聊一聊,如何使用百度AI实现图像识别的方法,在现实生活中,我们会看到停车场,高速路口有车牌识别。现在很多车牌方案商都有成熟的车牌识别技术,它们是靠这个吃饭的,不会开源。本次文章主要是使用这些方案商的接口来做识别,百度AI的识别效率是非常高的,毕竟让别人花钱的东西是不一样的。

239 0

【图像识别-车牌识别】基于BP神经网络求解车牌识别问题含GUI界面和报告

【图像识别-车牌识别】基于BP神经网络求解车牌识别问题含GUI界面和报告

249 0
我要发布
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等