用AI来做云安全是怎样一种体验?阿里云安全AI能力大曝光

本文涉及的产品
Web应用防火墙 3.0,每月20元额度 3个月
云安全中心漏洞修复资源包免费试用,100次1年
云安全中心 免费版,不限时长
简介: 阿里云内容安全大模型获CSA安全金盾奖

2024年11月15日,第八届云安全联盟大中华区大会在北京顺利召开,阿里云内容审核大模型荣获CSA 2024安全金盾奖,在市场份额与产品创新上均获得行业广泛认可。同时,阿里云安全产品负责人祝建跃参与圆桌对话,与业内各专家共同探讨「生成式AI在云安全的应用与风险管理」。

在AI时代,安全应该扮演什么样的新角色?
获奖.png

是AI 的使用者

不同于传统的机器学习模型,GPT模型自诞生以来,其强大泛化能力、数据处理能力、Fine-tuning带来优秀的迁移能力以及多模态融合所带来的复杂场景处理能力...在多类场景中均带来了效率提升,安全也不例外。

2023年,阿里云发布了基于通义千问底模的安全大模型,今年又发布了内容审核大模型,并将AI技术用在DDoS、Web应用防火墙、办公安全平台SASE等产品上,进一步提升检测效率,是AI时代的同行者。

内容审核大模型的「三管齐下」

AI安全领域最初引起人们热议的话题里,一定缺少不了对生成式内容安全以及其背后黑灰产业链的担忧,AIGC所带来的新生产模式背后,是生成量级和风险量级的指数级增长,传统工具的策略更新速度、覆盖特征、训练模式都无法跟上时代需求。

阿里云内容安全团队在过往「巨人的肩膀上」,展开了探索,并在通用大模型内容检测、SFT微调模型、轻量化模型三个方向展开了探索:
1.基于Prompt工程的通用大模型内容检测

依靠阿里各类「基础模型」的强大内容围观识别内容,通过API接口即可快速调用,即插即用,适用于新领域探索及快速知识积累,在应用该技术后,内容检测领域对标注成本下降 80%,标注效率提升200%。
1.png
2.基于SFT的内容安全大模型

除去通用场景以外,对于一些疑难领域,例如广告对抗、隐喻暗喻场景,传统技术难以获得明显效果提升。在这些领域,依赖大模型强大的通识和迁移能力,通过SFT快速迭代,迅速响应高对抗、难识别的风险场景防控。
6.jpg
在SFT技术应用之后:

暗喻分析推理领域效果提升44%

视觉攻击领域效果提升32%

广告对抗领域效果提升14%

意识形态领域效果提升7%

负向调性领域效果提升16%

3.知识蒸馏轻量化内容安全大模型

在大模型技术的工程化应用中,性能和成本也是绕不开的话题,阿里云通过知识蒸馏模式,实现90%的模型增益保留,同等效果上可获得更高的资源使用率,在特定场景可以节省约30%的人力;

从Qwen-max大语言模型蒸馏出0.5b模型,耗时从1-5s降低到40-50ms,A10卡qps25-30,具备生产实时链路使用的要求,同时,由于性能的提升,成本下降20+倍;

目前,阿里云内容安全大模型已经在内部多个场景中落地,极大提升了数据标注效率、复杂场景的对抗准确度等,但未来仍有长路要走,在多模态领域、性能成本优化、样本规模质量等方面,阿里云还将持续探索。

云安全大模型-安全运营的持续提效

除了内容安全领域,早在2023年,阿里云已经推出了云安全大模型,一方面通过告警的自动化处理,实现智能全链路一体化运营,有效降噪;另一方面为客户提供AI安全助手,用自然语言交互的方式,以专家的视角提供研判思路,支持层层深入对话,像一个虚拟的「高级安全技术专家」,步步引导,极大降低「经验依赖」。

玉琳@2x.png

如何成为一个优秀的安全大模型

1.底模的质量:通义千问大模型在行业内处于领先的第一梯队,而且作为“国服最强”的开源模型,积累了大量的客户群体,并持续迭代;

2.安全数据的数量:阿里云安全构建了全流程、全链路、全量的安全数据归集,覆盖百万级终端及上百种数据源,每天产生TGbps量级的安全数据;

3.安全数据的质量:云上统一的底座与规范的接口,让安全数据更易于统一的存储,并进行规范化处理与计算。此外,云上全域威胁图谱超千亿节点、千亿边关系网、亿级恶意IP、域名、URL,源自云安全每天的实战攻防,海量经验的积累沉淀,这也是阿里云安全大模型不可取代的核心优势之一;

4:模型技术的优化:类型成为可能,同时通过自动化的数据分析和智能识别,云安全大模型做到告警自动化处置及告警降嗓,减少了对高级专家的直接依赖,使得企业能够更高效地使用资源,快速应对安全挑战,同时确保决策的准确性;

5.持续性的检测评估与反馈:通过近两年的线上使用,阿里云安全大模型能力持续提升:7.png
目前,云安全大模型在产品咨询、告警研判、事件调查、联动响应、智能报告五大场景均有落地,形成了智能事件全链路一体化运营,显著提升企业的安全运维效率,让AI安全真的用起来。

当然,除了两个安全大模型以外,在云安全中心、Web应用防火墙、验证码、数据分类分级等安全产品、场景中均有落地,将安全防护水平和运营效率提升到了新高度,让云上客户率先享受到AI技术带来的红利。

更是AI 的保护者

随着AI技术的发展以及大众的接受度逐渐提升,通过自然语言交互的AI智能助手与人工智能生成内容(AIGC)开始崭露头角,成为行业里的“杀手级应用”。但随着使用群体的扩大,AI所带来的安全风险也愈发严重。

ChatGPT今年接连被曝出敏感数据泄漏,以及因DDoS攻击导致的服务中断:

  • 2024年2月香港某跨国企业分公司AI深度伪造诈骗案,涉案金额达到2亿港元;
  • 2024年7月北京执法公布10起AI造谣案及处罚情况;
  • 2024年9月某头部互联网企业被曝出在模型训练期间遭受注入式代码攻击,干扰内部模型训练业务;

除了积极拥抱AI技术以外,阿里云在今年着重升级了覆盖大模型全生命周期的安全防护体系,在数据采集、模型设计、训练、评测、部署及使用各阶段均提供了丰富的安全产品,满足客户步入智能时代的需求。

5.png

在AI基础设施层面

阿里云安全早已深度融合各云产品,为企业提供更高等级的安全选择。同时,面向企业复杂的IT环境,阿里云云安全中心、WAAP、DDoS防护等三款产品能统一对公共云、专有云等多维IT基础设施进行统管,实施一致的安全防护策略和应急响应,能帮客户大幅提升管理效率。

在模型研发SPLC周期中

涉及数据准备、模型训练、模型上线、内容生成等多个阶段,阿里云按照全国网络安全标准化技术委员会(即TC260)要求,全面落实安全措施。在训练阶段,通过SFT(有监督微调)、DPO(直接偏好优化)技术,构建安全预料、使用偏好数据集,对模型做正向引导;在评测阶段通过测评样本(Benchmark)覆盖TC260定义的31类风险。

在模型应用层面

最引人关注的是AIGC所带来的DeepFake(深度伪造)及内容安全问题。阿里云实人认证产品,现已能对AIGC生成人脸检测、PS换脸检测等八大DeepFake领域实现充分鉴伪,目前日均拦截攻击量达25万次,攻击拦截率高达99%;而在内容安全领域,除了使用传统算法识别有风险的AIGC内容,阿里云尝试用魔法对抗魔法。

  • 利用大模型构建海量的新型的AI风险样本,做到知己知彼;
  • 不断迭代算法,来提升模型针对AIGC的风险识别能力。

此外,在一些重要、严肃话题上,通过标准回答确保大模型输出结果的安全性和可靠性。目前,阿里云内容安全AIGC日均检测量级超过1个亿,帮助用户有效降低大模型输出的违规、风险内容比例。

在模型数据安全及隐私保护层面

阿里云在数据合规获取、数据标注安全及数据集安全检测等方面均有投入。同时阿里云早在2015年就发起了中国云计算服务商首个“数据保护倡议”,并在2021年首家发布《数据安全和隐私保护白皮书》,体系化保护所有云上客户数据安全。

在模型合规层面

针对AIGC所带来的版权归属、信息追踪、合规标识等诉求,阿里云提供支持图片、文档、音频、视频和APP等多种格式的数字水印解决方案。该方案在国内外拥有超过70项专利,并通过了国内权威的China DRM认证和国际权威的Cartesian认证。目前,它能够识别超过80种攻击手法,提取成功率超过90%。此外,阿里云还为客户提供算法合规备案咨询,帮助客户简化流程,快速实现业务落地。

4.jpeg

在结束的圆桌论坛上,阿里云安全产品负责人祝建跃分享到:云安全对于AI的尝试,一定要从实际业务痛点和客户需求角度出发,探索切实的落地场景。在未来,AI一定会在安全领域催生出新的商业模式,阿里云安全在AI的浪潮中,将会继续砥砺前行,持续迭代,提供给客户更好更优的安全产品。

相关文章
|
4天前
|
人工智能 Java Serverless
阿里云函数计算助力AI大模型快速部署
随着人工智能技术的快速发展,AI大模型已经成为企业数字化转型的重要工具。然而,对于许多业务人员、开发者以及企业来说,探索和利用AI大模型仍然面临诸多挑战。业务人员可能缺乏编程技能,难以快速上手AI模型;开发者可能受限于GPU资源,无法高效构建和部署AI应用;企业则希望简化技术门槛,以更低的成本和更高的效率利用AI大模型。
38 12
|
15天前
|
存储 人工智能 自然语言处理
拥抱Data+AI|B站引入阿里云DMS+X,利用AI赋能运营效率10倍提升
本篇文章针对B站在运营场景中的痛点,深入探讨如何利用阿里云Data+AI解决方案实现智能问数服务,赋能平台用户和运营人员提升自助取数和分析能力,提高价值交付效率的同时为数据平台减负。
拥抱Data+AI|B站引入阿里云DMS+X,利用AI赋能运营效率10倍提升
|
8天前
|
人工智能 NoSQL MongoDB
阿里云与MongoDB庆祝合作五周年,展望AI赋能新未来
阿里云与MongoDB庆祝合作五周年,展望AI赋能新未来
|
3天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
10天前
|
人工智能 数据可视化 专有云
阿里云飞天企业版获评2024年AI云典型案例
近日,由全球数字经济大会组委会主办、中国信息通信研究院和中国通信企业协会承办的“云·AI·计算国际合作论坛”作为2024全球数字经济大会系列活动之一,在北京举办。论坛以“智启云端,算绘蓝图”为主题,围绕云·AI·计算产业发展、关键技术、最佳实践等展开交流讨论。阿里云飞天企业版异构算力调度平台获评2024年AI云典型案例。
|
16天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
14天前
|
存储 人工智能 缓存
官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake
近日,清华大学和研究组织9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。
|
18天前
|
人工智能 架构师 大数据
广西广电X阿里云:共同成立全媒体AI实验室!
广西广电X阿里云:共同成立全媒体AI实验室!
29 5
|
16天前
|
存储 人工智能 缓存
官宣开源|阿里云与清华大学共建AI大模型推理项目Mooncake
2024年6月,国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。
|
9天前
|
人工智能 Kubernetes Cloud Native
荣获2024年AI Cloud Native典型案例,阿里云容器产品技术能力获认可
2024全球数字经济大会云·AI·计算创新发展大会,阿里云容器服务团队携手客户,荣获“2024年AI Cloud Native典型案例”。

相关产品

  • 云安全中心