ICPR 2018|阿里巴巴读光OCR及MTWI数据集亮相引关注

本文涉及的产品
文档理解,结构化解析 100页
小语种识别,小语种识别 200次/月
通用文字识别,通用文字识别 200次/月
简介: 近日,第24届国际模式识别大会(ICPR 2018)在北京举办,阿里巴巴“图像和美”团队成为会场焦点,在本次ICPR大会中,阿里巴巴“图像和美”团队集中展示了在OCR方向的学术能力与读光OCR的产品能力。

近日,第24届国际模式识别大会(ICPR 2018)在北京举办,阿里巴巴“图像和美”团队成为会场焦点,在本次ICPR大会中,阿里巴巴“图像和美”团队集中展示了在OCR方向的学术能力与读光OCR的产品能力。

阿里巴巴“图像和美”团队是阿里巴巴延续时间最久的图像识别团队,从事OCR研究超过7年,全面覆盖公司内网络图片、文档等类型,日均处理图片超过6亿,累计超千亿,并于2017年底在阿里云上推出了读光云产品,提供企业级的公有云和专有云服务。目前读光OCR已广泛运用于各行业领域,在办公自动化、文档电子化、数据智能等场景实现企业的生产应用。在本次ICPR的展区也重点展示了卡证识别、表单识别、增值税发票识别等综合识别能力。

640

(读光OCR在ICPR的展台)

本次阿里巴巴“图像和美”团队还和华中科技大学、中科院自动化所共同举办了首届深度学习文档分析和识别研讨会,吸引了上百名研究人员参加。研讨会上IAPR主席Simone Marinai教授、华南理工大学金连文教授、阿里巴巴高级算法专家永攀等人发表了报告,各位专家同步了学术界最新研究及工业界的落地进展,现场反响热烈。

6401

(阿里巴巴高级算法专家永攀在研讨会上的报告)


6402

(Simone Marinai教授在研讨会上做报告)


研讨会的最后,华南理工大学金连文教授、北京大学王勇涛教授、阿里巴巴高级算法专家永攀等嘉宾就“深度学习OCR和DAR领域的未来趋势”进行了探讨,包括深度学习模型构架、数据集构建、算法应用方向等学术界及工业界都共同关注的热门话题。阿里巴巴高级算法专家永攀表示:“阿里读光是OCR应用领域的先行者,在实践中,读光将模型、数据、应用融合,实现通用应用场景的OCR算法架构,并按应用场景构建了完善的数据集系统。OCR是最基础最广泛的AI应用方向,能够与各行业结合形成广泛的社会效应, 我们期待和学术界一起追求算法极限,探索接近客观规律的AI问题。”

6403

(研讨会现场座无虚席)


此次,阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI 2018 挑战赛在大会进行了报告和颁奖,ICPR MTWI 2018挑战赛是目前参赛人数最多的OCR竞赛,由阿里巴巴天池平台承办,共有4282支队伍参与竞赛。 同时, 本次竞赛标注并公开了MTWI数据集,是现有难度最大、内容最丰富的网络图片OCR数据集,也是阿里巴巴首个公开的OCR数据集。

6404

(阿里巴巴算法专家永麒在大会进行竞赛报告)


阿里巴巴算法专家永麒在大会报告中表示:“希望通过这个数据集和竞赛,回馈学术界,并且推动业界技术的发展。从最终的效果来看,参加竞赛的队伍包括了众多知名高校和企业,在本次竞赛中,企业展现出了比较大的竞争优势。这也表明,众多企业看好OCR应用,OCR进入了应用爆发期。不过在三个赛道,最好队伍的准确率都没有超过90%。这也表明了网络图片的技术难点还没有完全解决。我们也希望这次的竞赛能够促进业界对这类问题的研究,一起来彻底解决这些问题。”

6405

(阿里巴巴资深算法专家雷音为获奖队伍颁奖)


在本次ICPR 2018中,阿里巴巴“图像和美”团队通过竞赛、研讨会、展区展示等形式多元化、全方位的展现了团队在OCR方面的深度积累及学术能力、产品能力,也得到了与会人员的高度评价和关注。
相关文章
|
10月前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。
77 3
|
5月前
|
数据采集 监控 数据可视化
用Python构建动态折线图:实时展示爬取数据的指南
本文介绍了如何利用Python的爬虫技术从“财富吧”获取中国股市的实时数据,并使用动态折线图展示股价变化。文章详细讲解了如何通过设置代理IP和请求头来绕过反爬机制,确保数据稳定获取。通过示例代码展示了如何使用`requests`和`matplotlib`库实现这一过程,最终生成每秒自动更新的动态股价图。这种方法不仅适用于股市分析,还可广泛应用于其他需要实时监控的数据源,帮助用户快速做出决策。
354 0
|
5月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
186 0
|
6月前
|
网络安全 虚拟化 Windows
windows 11安装openSSH server 遇到的"kex_exchange_identification: read: Connection reset"问题
windows 11安装openSSH server 遇到的"kex_exchange_identification: read: Connection reset"问题
|
7月前
|
数据采集 物联网 数据挖掘
API接口的应用
API接口在现代技术中至关重要,它使不同软件、设备间能相互通信和数据共享。在社交网络中,如Facebook及Twitter的API让开发者能够构建交互式应用;移动应用则依赖API与服务器通信,实现天气查询、地图定位等功能;云计算平台如AWS通过API提供了资源管理和配置服务;物联网设备使用API实现数据交换;视频游戏开发商利用各类平台API发布游戏。此外,API爬虫数据接口技术通过爬虫抽取并输出数据,被广泛应用于获取商业、金融、医疗等领域的大数据,以支持数据分析、策略制定及业务流程优化,极大地提高了数据收集与处理的效率和准确性。
|
8月前
|
人工智能 JSON 文字识别
开源VLM新标杆 InternVL 2.0 怎么用?部署、微调尽在魔搭社区!
7月4日下午,世界人工智能大会科学前沿论坛,上海人工智能实验室OpenGVLab发布了InternVL 2.0 版本,中文名书生·万象。
|
8月前
|
人工智能 自动驾驶 算法
《人工智能伦理:机器的自主性与人类的责任》
随着人工智能(AI)技术的飞速发展,其应用已渗透到社会的各个领域。然而,AI技术的快速发展也带来了一系列伦理问题,特别是关于机器自主性与人类责任的界定。本文将探讨AI的伦理挑战,分析机器自主性的发展趋势,以及在AI决策过程中人类应承担的责任。通过案例分析和数据支持,我们将深入讨论如何在保障技术进步的同时确保伦理标准的制定和遵守,以实现人机和谐共存的未来。
171 0
|
人工智能 自然语言处理 自动驾驶
破壁人 AI 百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。
破壁人 AI 百度:科技公司反内卷的典型样本
|
10月前
|
域名解析 网络协议 开发工具
容器镜像服务ACR下载不了是什么原因呢?
【1月更文挑战第5天】【1月更文挑战第23篇】 容器镜像服务ACR下载不了是什么原因呢?
169 1
|
存储 机器学习/深度学习 分布式计算
利用PAI助力打造新一代社交推荐平台
本次主题的内容主要分三点介绍,第一是伊对的简介,第二是推荐平台的架构简介,第三是PAI在推荐平台的应用。
2979 0
利用PAI助力打造新一代社交推荐平台