2024年11月15日,第八届云安全联盟大中华区大会在北京顺利召开,阿里云内容审核大模型荣获CSA 2024安全金盾奖,在市场份额与产品创新上均获得行业广泛认可。同时,阿里云安全产品负责人祝建跃参与圆桌对话,与业内各专家共同探讨「生成式AI在云安全的应用与风险管理」。
在AI时代,安全应该扮演什么样的新角色?
是AI 的使用者
不同于传统的机器学习模型,GPT模型自诞生以来,其强大泛化能力、数据处理能力、Fine-tuning带来优秀的迁移能力以及多模态融合所带来的复杂场景处理能力...在多类场景中均带来了效率提升,安全也不例外。
2023年,阿里云发布了基于通义千问底模的安全大模型,今年又发布了内容审核大模型,并将AI技术用在DDoS、Web应用防火墙、办公安全平台SASE等产品上,进一步提升检测效率,是AI时代的同行者。
内容审核大模型的「三管齐下」
AI安全领域最初引起人们热议的话题里,一定缺少不了对生成式内容安全以及其背后黑灰产业链的担忧,AIGC所带来的新生产模式背后,是生成量级和风险量级的指数级增长,传统工具的策略更新速度、覆盖特征、训练模式都无法跟上时代需求。
阿里云内容安全团队在过往「巨人的肩膀上」,展开了探索,并在通用大模型内容检测、SFT微调模型、轻量化模型三个方向展开了探索:
1.基于Prompt工程的通用大模型内容检测
依靠阿里各类「基础模型」的强大内容围观识别内容,通过API接口即可快速调用,即插即用,适用于新领域探索及快速知识积累,在应用该技术后,内容检测领域对标注成本下降 80%,标注效率提升200%。
2.基于SFT的内容安全大模型
除去通用场景以外,对于一些疑难领域,例如广告对抗、隐喻暗喻场景,传统技术难以获得明显效果提升。在这些领域,依赖大模型强大的通识和迁移能力,通过SFT快速迭代,迅速响应高对抗、难识别的风险场景防控。
在SFT技术应用之后:
暗喻分析推理领域效果提升44%
视觉攻击领域效果提升32%
广告对抗领域效果提升14%
意识形态领域效果提升7%
负向调性领域效果提升16%
3.知识蒸馏轻量化内容安全大模型
在大模型技术的工程化应用中,性能和成本也是绕不开的话题,阿里云通过知识蒸馏模式,实现90%的模型增益保留,同等效果上可获得更高的资源使用率,在特定场景可以节省约30%的人力;
从Qwen-max大语言模型蒸馏出0.5b模型,耗时从1-5s降低到40-50ms,A10卡qps25-30,具备生产实时链路使用的要求,同时,由于性能的提升,成本下降20+倍;
目前,阿里云内容安全大模型已经在内部多个场景中落地,极大提升了数据标注效率、复杂场景的对抗准确度等,但未来仍有长路要走,在多模态领域、性能成本优化、样本规模质量等方面,阿里云还将持续探索。
云安全大模型-安全运营的持续提效
除了内容安全领域,早在2023年,阿里云已经推出了云安全大模型,一方面通过告警的自动化处理,实现智能全链路一体化运营,有效降噪;另一方面为客户提供AI安全助手,用自然语言交互的方式,以专家的视角提供研判思路,支持层层深入对话,像一个虚拟的「高级安全技术专家」,步步引导,极大降低「经验依赖」。
如何成为一个优秀的安全大模型
1.底模的质量:通义千问大模型在行业内处于领先的第一梯队,而且作为“国服最强”的开源模型,积累了大量的客户群体,并持续迭代;
2.安全数据的数量:阿里云安全构建了全流程、全链路、全量的安全数据归集,覆盖百万级终端及上百种数据源,每天产生TGbps量级的安全数据;
3.安全数据的质量:云上统一的底座与规范的接口,让安全数据更易于统一的存储,并进行规范化处理与计算。此外,云上全域威胁图谱超千亿节点、千亿边关系网、亿级恶意IP、域名、URL,源自云安全每天的实战攻防,海量经验的积累沉淀,这也是阿里云安全大模型不可取代的核心优势之一;
4:模型技术的优化:类型成为可能,同时通过自动化的数据分析和智能识别,云安全大模型做到告警自动化处置及告警降嗓,减少了对高级专家的直接依赖,使得企业能够更高效地使用资源,快速应对安全挑战,同时确保决策的准确性;
5.持续性的检测评估与反馈:通过近两年的线上使用,阿里云安全大模型能力持续提升:
目前,云安全大模型在产品咨询、告警研判、事件调查、联动响应、智能报告五大场景均有落地,形成了智能事件全链路一体化运营,显著提升企业的安全运维效率,让AI安全真的用起来。
当然,除了两个安全大模型以外,在云安全中心、Web应用防火墙、验证码、数据分类分级等安全产品、场景中均有落地,将安全防护水平和运营效率提升到了新高度,让云上客户率先享受到AI技术带来的红利。
更是AI 的保护者
随着AI技术的发展以及大众的接受度逐渐提升,通过自然语言交互的AI智能助手与人工智能生成内容(AIGC)开始崭露头角,成为行业里的“杀手级应用”。但随着使用群体的扩大,AI所带来的安全风险也愈发严重。
ChatGPT今年接连被曝出敏感数据泄漏,以及因DDoS攻击导致的服务中断:
- 2024年2月香港某跨国企业分公司AI深度伪造诈骗案,涉案金额达到2亿港元;
- 2024年7月北京执法公布10起AI造谣案及处罚情况;
- 2024年9月某头部互联网企业被曝出在模型训练期间遭受注入式代码攻击,干扰内部模型训练业务;
除了积极拥抱AI技术以外,阿里云在今年着重升级了覆盖大模型全生命周期的安全防护体系,在数据采集、模型设计、训练、评测、部署及使用各阶段均提供了丰富的安全产品,满足客户步入智能时代的需求。
在AI基础设施层面
阿里云安全早已深度融合各云产品,为企业提供更高等级的安全选择。同时,面向企业复杂的IT环境,阿里云云安全中心、WAAP、DDoS防护等三款产品能统一对公共云、专有云等多维IT基础设施进行统管,实施一致的安全防护策略和应急响应,能帮客户大幅提升管理效率。
在模型研发SPLC周期中
涉及数据准备、模型训练、模型上线、内容生成等多个阶段,阿里云按照全国网络安全标准化技术委员会(即TC260)要求,全面落实安全措施。在训练阶段,通过SFT(有监督微调)、DPO(直接偏好优化)技术,构建安全预料、使用偏好数据集,对模型做正向引导;在评测阶段通过测评样本(Benchmark)覆盖TC260定义的31类风险。
在模型应用层面
最引人关注的是AIGC所带来的DeepFake(深度伪造)及内容安全问题。阿里云实人认证产品,现已能对AIGC生成人脸检测、PS换脸检测等八大DeepFake领域实现充分鉴伪,目前日均拦截攻击量达25万次,攻击拦截率高达99%;而在内容安全领域,除了使用传统算法识别有风险的AIGC内容,阿里云尝试用魔法对抗魔法。
- 利用大模型构建海量的新型的AI风险样本,做到知己知彼;
- 不断迭代算法,来提升模型针对AIGC的风险识别能力。
此外,在一些重要、严肃话题上,通过标准回答确保大模型输出结果的安全性和可靠性。目前,阿里云内容安全AIGC日均检测量级超过1个亿,帮助用户有效降低大模型输出的违规、风险内容比例。
在模型数据安全及隐私保护层面
阿里云在数据合规获取、数据标注安全及数据集安全检测等方面均有投入。同时阿里云早在2015年就发起了中国云计算服务商首个“数据保护倡议”,并在2021年首家发布《数据安全和隐私保护白皮书》,体系化保护所有云上客户数据安全。
在模型合规层面
针对AIGC所带来的版权归属、信息追踪、合规标识等诉求,阿里云提供支持图片、文档、音频、视频和APP等多种格式的数字水印解决方案。该方案在国内外拥有超过70项专利,并通过了国内权威的China DRM认证和国际权威的Cartesian认证。目前,它能够识别超过80种攻击手法,提取成功率超过90%。此外,阿里云还为客户提供算法合规备案咨询,帮助客户简化流程,快速实现业务落地。
在结束的圆桌论坛上,阿里云安全产品负责人祝建跃分享到:云安全对于AI的尝试,一定要从实际业务痛点和客户需求角度出发,探索切实的落地场景。在未来,AI一定会在安全领域催生出新的商业模式,阿里云安全在AI的浪潮中,将会继续砥砺前行,持续迭代,提供给客户更好更优的安全产品。