带你读《阿里云安全白皮书》(二十四)——云上安全建设最佳实践(2)

本文涉及的产品
Web应用防火墙 3.0,每月20元额度 3个月
内容审核增强版开发者实践包,10万次资源包1年有效
云安全中心 免费版,不限时长
简介: 本文介绍了阿里云在AI大模型云上安全方面的最佳实践,涵盖数据安全、模型安全、内容安全和合规性四大关键挑战。阿里云通过数据加密、私有链接传输、机密计算等技术手段,确保数据和模型的安全性;同时,提供内容安全检测、Prompt问答护栏等功能,保障生成内容的合法合规。此外,阿里云还帮助企业完成算法及模型备案,助力客户在AI大模型时代安全、合规地发展。

点击链接下载查看完整版内容👉:《阿里云安全白皮书(2024版)》

点击链接下载查看上文👉带你读《阿里云安全白皮书》(二十三)——云上安全建设最佳实践


迎接未来:AI 大模型云上安全最佳实践

ChatGPT 的问世和成功引领生成式人工智能的蓬勃发展,各类 AI 大模型产品如雨后春笋般涌现, 正在各行各业积极探索应用落地场景。其中不乏 Perplexity 这样挑战 Google 搜索地位的新星、  妙鸭相机这样的爆火应用。


在 AI 大模型产品快速发展的前提下,如何保护各方数据安全与主权,并有效地帮助客户应对由这 些技术带来的算法安全和内容安全风险,已成为 AI 大模型时代云平台面临的关键命题,也是对数 智化基础设施的重大挑战。

1 AI 大模型关键安全风险

 

阿里云同时拥有领先的云计算业务与先进的大模型技术,基于自身 AI 大模型的安全建设实践,阿 里云希望能将这一未来重点领域的安全风险洞察、解决方案分享给社会。


一款 AI 大模型产品需经历数据准备、模型训练与微调、模型部署、模型运行阶段,在这些阶段过 程中,面临着众多威胁与挑战,其中四项关键挑战为:


-    数据安全挑战:

为了使通用模型在特定领域实现更好的智能,企业需要对其自身业务数据进行 提炼,并通过微调等技术将这些数据融入到模型中。鉴于这类数据对企业至关 重要,在数据的收集、清洗、分析及存储过程中,都需要有完善的安全机制进 行保障。

模型在线上运行服务期间,用户的 Prompt 输入及其返回的内容可能涉及用 户的隐私。因此,如何保障用户隐私不被侵犯成为 AI 大模型类产品的核心挑 战之一。


-    模型安全挑战:

模型承载了对数据的“记忆”,因此模型一旦泄露,等同于训练数据的泄露。   而模型在研发、部署阶段,大量的一线员工具备模型的访问权限,同时生产环  境也面临着与传统信息系统一样的外部入侵威胁。一旦系统存在可被入侵的漏  洞,就可能导致模型被外部攻击者窃取,从而间接导致参与训练的敏感数据泄露。


-    内容安全挑战:

生成式人工智能如果训练不当、使用不当,可能造成虚假信息与违法不良信息  的传播,甚至成为诈骗分子的非法牟利工具。其输出内容也可能存在违法违规、 违背道德伦理、内容失实、偏见歧视等问题。


-    合规性挑战:

在全球监管合规体系逐渐健全的趋势下,AI 大模型应用要遵守各地域各行业  的合规要求,由于训练推理过程中需接触大规模数据,其在数据隐私合规领域  的挑战尤为明显。除此之外,由于其技术的独特性,全球各国监管仍在积极探  索针对 AI 大模型的监管合规政策,AI 大模型需及时响应最新的监管合规要求, 在监督下有序发展。


为了帮助客户快速且安全地发展,我们也在关键环节推出了一系列产品功能, 以助力企业更好地应对 AI 大模型时代的安全挑战。


2 安全解决方案

 

2.1 数据安全

 

数据是实现 AI 大模型应用成功的三要素之一,要开发出强大的大模型应用,就需要将场景相关的 数据投喂给 AI 大模型应用来进行训练、对齐、微调。因此,  保护这些数据的安全性以及确保数据 持有方通过云平台进行模型训练过程中的数据主权就变得尤为重要。

2.1.1 百炼推理链路加密

为实现对数据安全的保护,阿里云基于百炼 MaaS 平台,设计实施了一系列 数据安全防护方案,包括专有网络访问通道、Prompt 加密、数据存储、应用 层传输加密、存储加密:

 

-    私有链接传输

为保障传输过程中网络信道安全问题,防止公网传输数据泄露,用户的推理调 用、数据访问使用阿里云 Private Link 在用户自己 VPC 和百炼间创建私有 链接,通过专网即可访问用户的存储实例完成训练、微调、推理等任务。且 VPC 提供网络流量监控与接口日志审计能力,可结合网络安全设备监控异常 调用、专网攻击等恶意行为,提供专网保护。

 

-    Prompt 加密

针对模型推理服务(纯模型调用、RAG 应用、Agent 应用)提供全链路的 加密方案。用户输入提示词 prompt 和模型生成的答案全程不可见。解密 只会发生在两个地方:根据用户输入 prompt 进行 RAG 片段召回、大模型 prompt 生成答案时。百炼保证在客户授权情况下,遵循最小必要原则对 prompt 进行解密和使用,并且该过程只在内存中瞬间存在,不做任何的持久 化存储。整体加密过程如右图所示:

image.png

-    应用层传输加密

在安全网络协议方面,为防止中间人、嗅探等网络攻击手段获取到用户与大模 型服务,阿里云百炼通过支持应用层使用 HTTPS 协议进行安全数据加密传 输以及采用传输层安全性 TLS 协议,为云服务和用户之间的数据传输提供保 障。TLS 可提供严格的身份验证、消息隐私性和完整性保障,能够有效检测 消息篡改、拦截和伪造行为。

 

-    存储加密

百炼平台模型推理、训练、RAG 应用的用户数据均支持外接存储部署方式, 支持外接 OSSESADBSLS。数据采集过程支持外接归属于客户的数 据库实例,用户对数据 100% 完全自主可控。这些产品支持使用服务密钥和 客户自选密钥作为主密钥进行数据加密,满足敏感数据密态存储的需要,可降 低数据泄露。

2.2 可信计算与机密计算能力


客户将数据托管到云平台,背后意味着对云平台的信任。阿里云承诺保障客户数据主权,并积极 探索从技术角度,根本性保障客户数据主权及机密性的机制。


阿里云具备完整的可信计算、机密计算基础储备,产品技术矩阵如下:

image.png

通过利用 IaaS 层级的机密计算能力,可以为大模型服务提供端到端的、覆盖 模型数据全生命周期的通用数据保护方案,保护客户运行时的数据机密性。在 机密计算能力的保护下,阿里云内部的管控服务、运维人员等也无法看到用户 输入的提示词 prompt、RAG 文档、微调后的模型等。

image.png

在先进的技术基础上,阿里云还与生态伙伴一起探索更上层的合作伙伴。蚂蚁  数科团队基于阿里云 ECS 机密计算、计算巢等基础能力,提供了面向 LLM  的大模型密态计算基座产品 MAPPIC,进一步为 AI 大模型应用安全提供支撑。

image.png

2.3 内容安全

目前,AI 大模型技术在自然语言对话场景中得到了广泛的应用。在内容安全方面,需要确保输出 内容的社会安全性,包括是否合法合规、是否遵守道德伦理和公序良俗等,具体表现在防止出现 违法不良信息、内容失实、偏见歧视以及违反伦理道德等。

阿里云为此建立了完整的大模型内容安全解决方案:

 

-    训练语料数据去毒

为进一步提升定制用户的模型训练和测试、知识库数据及模型训练微调质量, 防止针对模型数据集投毒攻击,除百炼内置阿里绿网提供内容安全能力,支持 对用户自有的 OSS 资源中多种违规内容(例如涉黄、暴力、违法等)的实时 监控、检测和拦截。

此外,数据安全中心 / 内容安全提供了覆盖图片、视频、语音、文字等多媒体  的内容风险检测的能力,帮助用户发现暴恐、色情、涉黄、暴力、惊悚、敏感、 禁限、广告、辱骂等风险内容或元素,支持对训练语料进行拦截或清洗。

 

-    Prompt 问答护栏

为了满足更高安全需求的用户,数据安全中心(sddp)/ 内容安全可进一步提 升实时提问管控能力,进行风险异常识别,支持意图识别,实时过滤伦理、价 值观、个人敏感数据,进行安全问答阻断。可根据用户需求,构建安全知识库 与专项知识库,实现数据安全规则灵活自定义与风险决策。

image.png

 全流程内容安全保障

若企业对于内容安全防护具备更高的定制需求,也可以使用阿里云的大语言模 型内容安全解决方案,在自建系统中集成内容安全产品 API,实现覆盖“样本 和训练管理”“模型应用”“举报与处置”“审核优化”四大阶段的内容安全 整体治理。


2.4 模型安全

保护模型本身的安全,与其它信息系统的基础安全保障类似,需通过一系列流程与解决方案,确 保系统漏洞不被外部攻击者恶意利用。

对于云平台,阿里云通过“全流程产品安全流程”与“红蓝对抗”切实保障了云平台本身的安全水位。

对于部署在云上的大模型系统,可使用云上弹性可扩展的安全防护能力,体系化地完成生产网、 办公网安全建设。并通过云安全中心等产品,及时发现并治理线上风险。


2.5 合规性

阿里云同时拥有先进的大模型 AI 技术与云平台产品,在合规性建设方面,一方面积极跟进自身合 规性建设,另一方面也在帮助云上客户完成大模型服务合规性建设。


为了进一步帮助客户更好满足《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成 管理规定》《生成式人工智能服务管理暂行办法》等监管要求,阿里云通过安全产品为客户提供 算法及模型备案需要的安全技术能力,同时为客户提供作为服务提供者的互联网信息服务算法备 案、生成式人工智能服务备案两项咨询服务,帮助客户更好合法合规开展互联网信息服务业务。

针对用户使用百炼进行微调后的模型,阿里云内容安全产品在模型评测阶段,提供安全性专项测  试服务,帮助用户了解大模型对输入、输出内容的风险防控水位。另外可提供内容安全算法备案号, 帮助客户简化备案过程。

相关文章
|
26天前
|
存储 云安全 安全
带你读《阿里云安全白皮书》(二十一)——云上安全重要支柱(15)
阿里云安全白皮书(2024版)详细介绍了其在面对线上威胁时的快速响应与恢复能力。通过一体化的安全运营能力,阿里云帮助客户在极端威胁下快速感知、响应风险并恢复数据及服务。白皮书还涵盖了全面的资产梳理、及时的威胁情报分析、高效的风险识别与治理、专业的安全服务等内容,旨在为企业提供全方位的安全保障。
|
26天前
|
云安全 监控 安全
带你读《阿里云安全白皮书》(二十三)——云上安全建设最佳实践
淘宝作为全球最大规模、峰值性能要求最高的电商交易平台,基于阿里云成功通过了多年“双11”峰值考验。淘宝的安全体系涵盖了系统安全、网络安全、账号与凭据安全、云资源安全等多个方面,通过阿里云提供的多种安全产品和服务,确保了业务的稳定运行和数据的安全。淘宝的安全实践不仅为自身业务提供了坚实的保障,也为其他行业的云上安全建设提供了宝贵的经验和参考。
|
26天前
|
云安全 存储 安全
带你读《阿里云安全白皮书》(二十二)——云上安全重要支柱(16)
在全球化背景下,阿里云高度重视云平台的安全合规建设,确保客户在不同地区和行业能够满足监管要求。阿里云通过140多项安全合规认证,提供全面的专业安全合规服务和便捷高效的安全合规产品,帮助企业高效且低成本地实现安全合规目标。更多详情可参见阿里云官网“阿里云信任中心 - 阿里云合规”。
|
28天前
|
云安全 存储 安全
带你读《阿里云安全白皮书》(二十)——云上安全重要支柱(14)
本文介绍了阿里云在企业多账号管理和身份权限管理方面的解决方案。针对中大型企业面临的账号管理复杂性和安全合规挑战,阿里云提供了资源目录(Resource Directory)和Control Policy等工具,实现账号的有序管理和权限的精细控制。此外,阿里云还支持企业内部身份与云上身份的关联与映射,通过单点登录(SSO)简化身份管理,降低安全风险。这些措施有助于企业在云上实现高效、安全的资源管理。
|
28天前
|
云安全 安全 数据安全/隐私保护
带你读《阿里云安全白皮书》(十八)——云上安全重要支柱(12)
随着数智化发展,企业面临复杂的资产管理需求。阿里云提供全链路身份管控与精细化授权方案,涵盖细粒度权限管理和身份凭证保护,确保数据资产安全。支持多因素认证和最小权限原则,减少风险暴露,提升企业安全效率。详情见《阿里云安全白皮书(2024版)》。
|
28天前
|
云安全 安全 网络安全
带你读《阿里云安全白皮书》(十一)——云上安全重要支柱(5)
阿里云通过内部红蓝对抗体系,常态化模拟真实场景下的APT攻击,持续提升平台安全性。蓝军团队采用MITRE ATT&CK框架,系统模拟外部攻击,红军团队则进行持续防守。整个过程包括攻击规划、执行和复盘修复阶段,确保及时发现并修复安全漏洞,提升整体防御水平。
|
28天前
|
云安全 安全 数据可视化
带你读《阿里云安全白皮书》(十二)——云上安全重要支柱(6)
阿里云构建了7x24小时全自动化红蓝对抗平台,通过深度整合内外部攻防案例,进行高频次、自动化的演练,提升对复杂攻击的应对能力,确保安全防护体系持续优化。平台具备全自动化演练、随机性与多样化、可视化输出、节点负载智能控制、日志追踪与审计、应急场景秒级熔断等特性,确保演练过程稳定高效。
|
28天前
|
云安全 存储 运维
带你读《阿里云安全白皮书》(十七)——云上安全重要支柱(11)
阿里云提供了《阿里云安全白皮书(2024版)》,介绍客户数据安全保护技术能力。针对敏感行业,阿里云推出了专属区域和云盒两种形态,确保数据本地存储和合规要求,同时提供标准的公有云产品。此外,阿里云数据安全中心提供敏感数据识别、细粒度数据审计、数据脱敏/列加密、数据泄露检测与防护等四大功能,全面保障数据安全。
|
28天前
|
云安全 安全 测试技术
带你读《阿里云安全白皮书》(十三)——云上安全重要支柱(7)
阿里云通过全方位红蓝对抗反向校验,引入国内外优秀的第三方渗透测试服务,确保云平台及产品的安全性达到国际领先水平。同时,通过外部安全生态建设,与白帽社区合作,建立阿里安全响应中心(ASRC)和先知平台,提升整体安全水位。
|
28天前
|
云安全 存储 安全
带你读《阿里云安全白皮书》(十六)——云上安全重要支柱(10)
阿里云提供了全面的数据安全保护措施,包括细粒度访问控制策略、网络访问控制、私网访问通道、RAM权限管理、安全组能力、可信计算与机密计算等,确保客户数据的主权和机密性。

热门文章

最新文章