AI时代的浪潮以万钧之势袭来,今年随着AI Agent的爆发,AI应用的用户量级与流量规模呈指数级上升。如何在技术创新和安全合规之间实现平衡成为全行业关注的重要命题。
在这样的背景之下,硅基流动成立不过两年已经成长为AI领域独角兽。其核心产品一站式大模型云服务平台,基于自研推理引擎,实现大模型高效推理加速,让用户无需关注底层技术细节与高昂算力成本,助力开发者和企业聚焦产品创新。目前,硅基流动已与国内外多家大客户建立战略合作伙伴关系,携手多家标杆客户实现应用落地。
在快速发展的同时,硅基流动始终将平台的安全合规置于重要位置。今年硅基流动携手阿里云安全团队,共同探索AI时代的安全防护方案,为每一位客户提供安全稳定的AI体验。
阿里云AI安全护栏 :大模型的“智能过滤系统”
面对AI时代的新型安全挑战,阿里云AI安全护栏就像一套"智能过滤系统",在不打扰用户体验的前提下,默默守护着硅基流动大模型服务平台的每一次交互。
AI安全护栏(AI Guardrails)是阿里云为人工智能系统设计的安全防护产品,为保障AI业务的合规、安全、稳定而生,面向预训练大模型、AI服务和AI Agent等不同的业务形态,提供全链路防护体系。尤其在生成式AI的输入输出场景,安全护栏可提供精准的风险检测与主动防御能力,包括内容合规检测、敏感内容检测、提示词攻击检测等全方位检测能力。

ALL IN ONE API的多模态内容合规检测
阿里云安全护栏的设计目标是“简单、高效、无门槛”,为客户提供All In One API的调用模式。AI安全护栏提供一个全模态的统一接口,只需调用一个API,就能同时满足文本、图片、文件、音频、视频等多模态内容的交叉检测,无论是内容合规、提示词攻击拦截还是恶意文件扫描,都可以在一次API调用中全部完成检测。
流式检测方案,客户无感
作为国内头部的大模型服务平台,硅基流动的客户量级和调用量级巨大。阿里云AI安全护栏采用API流式检测方案,即采用本地累计N个字符后将这N个字符送审,或每累计X个字符后将最近的N个字符审核一次的方式,既可以保留上下文,也可以极大降低等待时间,做到客户无感的安全防护。
提示词攻击检测
针对生成式AI的注入式攻击,AI安全护栏可精准识别越狱指令、角色扮演诱导、系统指令篡改等对抗性攻击行为,构建AI系统的“免疫防线”。覆盖AI Agent的指令交互安全防护、开放域对话系统的对抗攻击防御、第三方插件调用的权限管控等场景。
除了API的接入方式以外,AI安全护栏还与阿里云的AI基础设施类产品深度结合,支持在阿里云百炼、AI网关、Web应用防火墙中一键开启调用,满足客户不同业务场景的防护需求。
以AI防AI:为企业创新护航
在阿里云与硅基流动合作的过程中,AI安全护栏一直以便捷、高效、全面的产品能力,让创新能跑得更稳:
成功发现并拦截大量高风险的大模型输入输出内容,包括色情、攻击辱骂、涉政、不良价值观等;
检测并识别众多针对模型的提示词攻击风险,包括假定角色越狱、直接提示词注入、DAN越狱等等;
AI时代的安全,也在与时俱进。AI安全护栏能力的背后,离不开云安全和通义团队的深度合作,双方联合研发了文本审核、图像审核以及多模态审核等多个大型模型,拓展了审核类型,提升了准确度和审核效率,持续为客户提供行业领先、可信赖的AI安全解决方案。
- 全面识别
支持内容合规、数据泄漏、提示词攻击等多安全检测,深度防护AI输入和输出风险;
- 精准检测
基于AI语义理解,精准识别隐喻表达、意识形态等高对抗风险;
- 超高可用
每秒千级并发处理能力,毫秒级完成内容检测;
- 动态配置
支持客户可视化配置风险检测内容、自定义阈值和黑白名单,灵活运营。