海康威视基于深度学习的“文字识别技术”在国际竞赛中斩获第一

简介:
近日,海康威视研究院预研团队基于深度学习技术研发的OCR(Optical Character Recognition,图像中文字识别)技术,刷新了ICDARRobust Reading竞赛数据集的全球最好成绩,并在“互联网图像文字”、“对焦自然场景文字”和“随拍自然场景文字”三项挑战的文字识别(Word Recognition)任务中,大幅超越国内外强劲参赛团队,标志着海康威视的文字识别技术达到国际领先水平。
 
ICDAR(InternationalConference on Document Analysis and Recognition)全称为文档分析与识别国际会议,由国际模式识别协会(IAPR)主办。它组织的文档分析与识别竞赛是当前OCR技术领域全球最具影响力的比赛,从2003年至今已举办5届。其中2015竞赛两年来,已吸引了来自82个国家的2367支队伍参加,其中包括Google、微软、百度、三星、旷视等团队,竞赛中涌现的许多方法都对文字识别技术的发展起到了强大的推动作用。
 
图1RobustReading竞赛的三项主要任务
 
这些任务中待识别的文字位于复杂图像背景中,成像存在噪声、模糊、透视、倾斜以及排列随意等不利因素,甚至字体格式种类繁多。海康威视的OCR技术,克服种种困难,在三项文字识别任务中均取得了世界第一,分别在Web and Email Born-Digital Images任务中以5.6%的优势超越第二名,在FocusedScene Text和Incidental Scene Text任务中超越第二名3.4%和3.1%。
 
图2 Born-Digital Images识别评测结果显示HIK_OCR排名第一
 
图3 Focused Scene Text识别评测结果显示HIK_OCR排名第一
 
图4 Incidental Scene Text识别评测结果显示HIK_OCR排名第一
 
近年来文字识别技术的突破,很大程度上依赖于深度学习的发展。海康威视预研团队设计了一个数十层的卷积神经网络来完成图像的信息编码,然后使用启发式的注意力模型,实现从特征到文字的解码。其中,专为文本识别设计的启发式机制,能够对注意力模型提取的特征进行合理性评估,使注意力模型在复杂场景中,具有强大的稳定性。
 
图5 海康威视文字识别技术原理示意
 
借助先进的OCR技术,海康威视的文字识别系统能够应对更为复杂文字识别场景,如污损及模糊、背景干扰及形变、恶劣天气等。目前,基于全新OCR技术的海康威视车牌识别系统已经覆盖全球六十余个国家和地区。基于车牌识别技术的卡口、电子警察、出入口控制、停车系统等应用也已经全面铺开。
 
图6 通用车牌识别的典型应用场景
 
除此之外,此次竞赛成果还可以应用到机器视觉领域的标签表单识别、民生领域的卡证执照识别、互联网领域的恶意图片识别、汽车辅助驾驶领域的路牌识别、城市管理领域的横幅标语和街景识别等产品中,大幅提升产品性能与应用效果。
 
在如今人工智能的浪潮里,海康威视将充分利用自身大数据的积累及人工智能技术优势,快速提升OCR技术性能,并不断推动机器的智能化和自动化水平的提高,在视频监控、智能感知和场景理解等方面为客户持续创造价值。


   

 

  
本文转自d1net(转载)  
目录
相关文章
|
1天前
|
机器学习/深度学习 传感器 人工智能
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第15天】随着人工智能技术的飞速发展,尤其是深度学习在图像处理领域的突破性进展,自动驾驶系统得以实现更加精准和高效的环境感知。本文章深入探讨了深度学习技术在自动驾驶车辆图像识别中的运用,分析了卷积神经网络(CNN)等模型在车辆、行人以及交通标志识别上的优势与挑战。同时,本文还针对当前自动驾驶系统中存在的数据偏差、实时处理能力及安全性问题提出了潜在的解决策略,并展望了未来发展趋势。
|
1天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第14天】 随着人工智能技术的突飞猛进,特别是深度学习在图像处理领域的应用,为自动驾驶汽车的环境感知和决策提供了新的解决方案。本文将探讨基于深度神经网络的图像识别技术如何增强自动驾驶系统的性能,包括车辆检测、行人识别以及交通标志识别等方面。通过分析现有文献和最新研究成果,我们概述了关键技术挑战,并提出了潜在的改进方向。此外,文章还对目前自动驾驶领域中深度学习技术的实际应用情况进行了案例分析,以期为未来研究提供参考。
|
1天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第14天】 随着人工智能技术的飞速发展,深度学习已成为推动多个领域革新的关键力量。特别是在图像识别领域,深度学习技术已经实现了巨大的突破,为自动驾驶系统提供了强大的视觉处理能力。本文将探讨深度学习技术如何增强自动驾驶车辆的环境感知能力,以及这些技术是如何被集成到复杂的驾驶决策过程中的。通过对现有文献和最新研究成果的综合分析,我们将概述当前最前沿的算法和架构,并讨论它们在实际道路测试中的表现。
|
1天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第14天】 随着人工智能领域的飞速发展,特别是深度学习在图像处理和识别方面取得的重大进展,自动驾驶技术迎来了前所未有的发展机遇。本文旨在探讨基于深度学习的图像识别技术如何被集成到自动驾驶系统中,以及这种集成如何提高车辆的环境感知能力、决策效率和安全性。文中首先回顾了当前自动驾驶技术面临的挑战,随后详细介绍了深度学习技术的核心原理和在图像识别方面的应用,最后通过案例分析展示了该技术在实际自动驾驶场景中的表现和潜力。
21 7
|
1天前
|
机器学习/深度学习 边缘计算 人工智能
揭秘深度学习在图像识别中的核心技术与挑战
【5月更文挑战第13天】 随着计算机视觉技术的飞速进步,深度学习已成为推动图像识别领域革新的主要动力。本文深入剖析了深度学习在图像识别任务中的核心算法和技术,包括卷积神经网络(CNN)的架构优化、数据增强的重要性、损失函数的选择以及模型压缩和加速策略。同时,文章也指出了当前技术面临的主要挑战,如数据集偏差、模型泛化能力、对抗性攻击等,并探讨了潜在的解决方案。通过综合分析和讨论,旨在为研究者和实践者提供指导,促进图像识别技术的发展和应用。
|
1天前
|
机器学习/深度学习 数据采集 监控
基于深度学习的图像识别技术在智能监控系统中的应用
【5月更文挑战第12天】 随着人工智能技术的迅猛发展,深度学习在图像处理领域已经取得了显著的成就。尤其是在图像识别任务中,卷积神经网络(CNN)等先进模型的应用极大提高了识别精度与效率。本文旨在探讨基于深度学习的图像识别技术如何被集成到智能监控系统中,以增强其自动检测和响应异常事件的能力。通过分析现有文献和最新研究成果,文章将详细阐述相关技术原理、系统架构、以及在实际场景中的应用效果,并讨论了面临的主要挑战和未来的发展方向。
|
1天前
|
机器学习/深度学习 传感器 人工智能
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动多个科技领域前进的关键力量。特别是在图像处理和识别方面,深度学习模型已经展现出了超越传统算法的性能。本文将探讨一种基于深度卷积神经网络(CNN)的图像识别技术,并分析其在自动驾驶系统中的应用。我们将重点介绍该技术如何提高自动驾驶汽车对周围环境的感知能力,以及它在未来交通生态中的潜在影响。
|
1天前
|
机器学习/深度学习 人工智能 算法
构建高效AI系统:深度学习优化技术解析
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动创新的核心动力。本文将深入探讨在构建高效AI系统中,如何通过优化算法、调整网络结构及使用新型硬件资源等手段显著提升模型性能。我们将剖析先进的优化策略,如自适应学习率调整、梯度累积技巧以及正则化方法,并讨论其对模型训练稳定性和效率的影响。文中不仅提供理论分析,还结合实例说明如何在实际项目中应用这些优化技术。
|
1天前
|
机器学习/深度学习 传感器 自动驾驶
探索基于深度学习的图像识别技术在自动驾驶领域的应用
【5月更文挑战第10天】 随着人工智能技术的飞速发展,特别是深度学习在图像处理和识别方面的突破性进展,自动驾驶汽车逐渐成为现实。本文将深入探讨深度学习技术在图像识别领域的应用,以及如何通过这些技术提高自动驾驶系统的性能和安全性。我们将分析卷积神经网络(CNN)在车辆检测、行人识别和交通标志识别中的作用,并讨论数据增强、迁移学习和对抗网络等策略如何帮助提升模型的泛化能力和鲁棒性。此外,文中还将涉及深度学习模型在实时处理和嵌入式系统部署时面临的挑战及其解决方案。
|
1天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第10天】 随着人工智能技术的飞速发展,基于深度学习的图像识别技术已成为自动驾驶系统不可或缺的核心组成部分。该技术通过模拟人类视觉系统处理与理解环境信息的过程,赋予自动驾驶车辆高度准确和实时的环境感知能力。本文首先概述了深度学习在图像识别领域的关键技术与方法,包括卷积神经网络(CNN)及其变体、循环神经网络(RNN)等,并探讨了这些技术在自动驾驶系统中的具体应用,如车辆检测、行人识别、交通标志识别以及道路场景理解。随后,文章分析了当前技术面临的主要挑战,包括数据集的多样性与质量、模型泛化能力、实时处理要求及系统的鲁棒性问题。最后,展望了未来图像识别技术在自动驾驶领域的发展趋势,特