前言
在当今社会,图像是信息传播和表达的重要方式之一。但是,随着技术的进步,人们可以轻松使用各种图像编辑软件来篡改、伪造图片,制造出看似真实但实际上虚假的场景。
这种现象无疑是给社会带来了一系列负面影响。首先,大量基于虚假图片产生的诈骗案件层出不穷。通过伪装成真实场景的虚假图片,不法分子能够欺骗受害者,获取他们的个人信息或财产,造成严重经济损失。其次,网络暴力事件也频繁出现。人们可以利用图像编辑软件在无需实际发生的情况下制造虚假事件,散布谣言,并对特定个体或群体进行恶意攻击。这导致了社会的紧张局势和消极情绪的扩散,对人们的心理健康和社会稳定造成了威胁。
最好的解决方法就是,以魔法打败魔法(用科技战胜科技),因此,我们有必要了解下合合信息在世界人工智能大会上为我们推出的图像篡改检测的“黑科技”。
)
AI图像篡改检测技术
在我们的日常生活中,我们都会分享一些聊天记录的截屏,一些和亲朋好友之间的红包,转账,但是这些信息是否被篡改过呢?基于这个信息,合合信息专门开展了图像文档的主题研究。研究主题方向包括四个类别,复制移动(一个图片中的信息复制到另一个地方);拼接(两个毫不相干的图片拼接到一起);擦除(擦除图像文档里面的一些关键信息);重打印(在擦除的基础上编辑一些新的文档)。
合合信息的这项技术是基于深度学习的图像篡改检测技术及相关系统,通过学习图像被篡改后统计特征的变化,智能捕捉图像在篡改过程中留下的细微痕迹,并以热力图的形式展示图像区域篡改地点,相关技术已在银行、保险等领域落地应用。
如下合合信息图像篡改检测技术应用效果展示:
“重打印”篡改图片检测:将一张图片输入到合合信息AI图像篡改检测模型中,模型便能够判别这张图像是否被篡改,并且定位图像的篡改区域,效果展示:
合合信息同时提出了一种基于HRNet的编码器-解码器结构的图像真实性鉴别模型,结合图像本身的信息,包括但不限于噪声、频谱等, 从而捕捉到细粒度的视觉差异,达到高精度鉴别效果。
AIGC生成图像引发问题
在前言部分也提到了虚假图像给社会带来的负面问题,在这里普及下什么是AIGC。AIGC(Artificial Intelligence Generated Content),是由人工智能生成的图像内容。近年来,随着深度学习和生成对抗网络(GANs)等技术的快速发展,AIGC在各个领域得到了广泛应用。
那么,它是如何生成图像的呢?
首先,AIGC生成图像的过程通常基于神经网络模型。它使用大规模数据集对模型进行训练,使其具备学习图像特征和样式的能力。然后,通过调整模型的参数和输入噪声,可以生成具有逼真外观的新图像。
除此之外,AIGC生成的图像可以具备多种风格和内容,例如人脸、自然风景、动物等。这些图像在视觉上与真实图像非常相似,往往难以分辨是否为真实拍摄的照片还是由AI生成的。
最重要的一点是,AIGC生成图像的应用领域广泛。在艺术创作方面,艺术家可以利用AIGC生成图像作为灵感源泉,打破传统创作限制;在设计和广告行业中,AIGC生成图像可以用于产品渲染、广告宣传等;在游戏开发领域,AIGC生成图像可以用于场景和角色的设计;在虚拟现实和增强现实技术中,AIGC生成图像可以为用户提供更丰富、逼真的虚拟体验。
所以,这些虚假图像的制作和滥用可能导致信息误导、侵犯我们的隐私等等众多风险。
生成式图像鉴别
上文提到,不法分子可能通过生成的图片去规避版权、身份验证,非法获取利益,给人民群众造成财产损失。
基于此,对于一些生成图和真实图片相似度极高的情况以及生成式图像场景繁多且无法穷举的问题,合合信息在算法中考虑了空域和频域的关联性,将多维度特征进行综合评估。这种综合评估能够更准确地区分生成式图片和真实图片之间的微小差异,从而提高判别的真实性和准确性。
模型结构如下图所示:
当我们输入图片后,模型通过多个空间注意力头来关注空间特征,并使用纹理增强模块放大浅层特征中的细微伪影,增强模型对真实人脸和伪造人脸的感知与判断准确度。
无论是在金融,传媒,还是其他行业,生成式图像检测技术都能降低一定的侵权问题,降低资金盗刷概率,它在反诈骗、版权保护等领域的起到了重大的作用。
OCR对抗攻击技术
什么是OCR呢?
OCR,英文全称为Optical Character Recognition,光学字符识别,它是一种将印刷体或手写体的文字转换为可编辑文本的技术。它通过使用图像处理和模式识别算法,将图像中的字符识别并转化为计算机可读的文本形式。
OCR技术在提取身份证件个人信息方面具有广泛的应用。通过将身份证件图像输入到OCR系统中,可以自动识别和提取身份证上的个人信息,包括姓名、性别、民族、出生日期、身份证号码等。
主要大概包括几个步骤:
图像预处理:对身份证图像进行预处理,包括图像增强、裁剪、去噪等操作,以提高图像质量和字符边缘的清晰度。
区域定位:通过图像处理算法,确定身份证上个人信息所在区域的位置。这些区域通常包括姓名、性别、民族、出生日期、身份证号码等。
字符分割:在确定了个人信息区域后,需要将每个字符从图像中分割出来,以便后续的字符识别。
字符识别:针对每个字符,使用OCR算法将其转换为可读文本。常见的OCR算法包括基于模板匹配的方法、基于深度学习的方法等。这些算法会将字符与事先训练好的模型进行比对,从而确定每个字符的识别结果。
后处理:对于识别出的字符,可能存在错误或不一致。为了提高识别准确性,可以进行后处理操作。比如使用校验算法验证身份证号码的有效性,或者结合字典、语言模型进行错误修正。
因此,基于个人、企业业务的文件资料保密需求,合合信息进行了创新技术探索,研发了OCR对抗攻击技术来进行文档图片“加密”。
下图是合合信息OCR对抗攻击技术应用效果展示,可对关键信息进行遮盖,在不影响肉眼观看的情况下阻止机器自动爬取:
OCR对抗攻击技术可在不影响肉眼观看与判断的情况下,对场景文本或者文档内文本进行扰动,对包含中文、英文、数字等关键信息的内容进行“攻击”,防止第三方通过OCR系统读取并保存图像中所有的文字内容,降低数据泄露的风险,以此达到保护信息的目的。
推动图像内容安全行业发展标准建立,助力可信AI系统化落地
中国信通院牵头启动了《文档图像篡改检测标准》制定工作,旨在建立图像内容安全行业的发展秩序,并为可信AI系统化落地提供支持,合合信息是该标准的重要参与者之一。
标准将聚焦细粒度视觉差异伪造图像鉴别、生成式图像判别、文档图像完整性保护等议题,凝聚行业共识,为行业提供有效的指引。
合合信息作为一家在智能文字识别和智能图像处理领域深耕的公司,在智能文档处理方面取得了认可,并通过中国信通院的评估获得了最高评定等级。
未来,合合信息将与学术和产业合作伙伴共同推动AI图像内容行业的安全可信发展。
文章到这里就先结束了,后续会继续分享相关的知识点。