使用Gateway with Inference Extension对接内容安全实现生成式AI内容审查

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 通过插入External Processing插件,Gateway with Inference Extension可对接阿里云内容安全,实现生成式AI输出的内容审查,确保AI应用合法合规。需先搭建环境并开通文本审核服务,再部署插件及配置策略,最后验证审查效果。

通过在请求处理过程中插入额外的External Processing插件,Gateway with Inference Extension可以对接阿里云内容安全来检测生成式AI输出输出内容审查,保证AI应用的内容合法合规。

前提条件

  1. 已经参考快速体验Gateway with Inference Extension智能推理路由,搭建Gateway with Inference Extension快速体验环境。
  2. 已经开通阿里云内容安全文本审核增强版服务,并为RAM子账号授权,具体操作,参考面向大语言模型的文本审核PLUS服务

操作步骤

步骤一:部署ACKTrafficFilter 声明插件服务

  1. 使用以下yaml,创建acktrafficfilter.yaml文件。
apiVersion: inferenceextension.alibabacloud.com/v1alpha1
kind: ACKTrafficFilter
metadata:
  name: aisg
spec:
  aiContentSecurity:
    accessKey: XXXXXX
    secretKey: XXXXXX
    aliyunEndpoint: green-cip-vpc.cn-hangzhou.aliyuncs.com

其中插件服务的关键启动参数需要根据实际环境修改,参数说明如下:

参数

描述

accessKey

具有AliyunYundunGreenWebFullAccess权限的子账号AK

secretKey

具有AliyunYundunGreenWebFullAccess权限的子账号SK

aliyunEndpoint

阿里云内容安全endpoint的域名,可参考面向大语言模型的文本审核PLUS服务获取接入域名。

  1. 执行以下指令,在集群中部署插件服务。
kubectl apply -f acktrafficfilter.yaml

步骤二:在httproute中接入ACKTrafficFilter插件对接内容安全审查

  1. 使用以下yaml,创建 httproute.yaml文件。
apiVersion: gateway.networking.k8s.io/v1
kind: HTTPRoute
metadata:
  name: mock-route
spec:
  parentRefs:
  - group: gateway.networking.k8s.io
    kind: Gateway
    name: mock-gateway
    sectionName: llm-gw
  rules:
  - backendRefs:
    - group: inference.networking.x-k8s.io
      kind: InferencePool
      name: mock-pool
    filters:
    - type: ExtensionRef
      extensionRef:
        group: inferenceextension.alibabacloud.com
        kind: ACKTrafficFilter
        name: aisg
    matches:
    - path:
        type: PathPrefix
        value: /
  1. 执行以下命令,更新集群中的HTTPRoute资源,在路由中通过filters引用ACKTrafficFilter资源对接内容审查服务。
kubectl apply -f httproute.yaml

步骤三:验证内容审查效果

  1. 获取网关IP
export GATEWAY_ADDRESS=$(kubectl get gateway/mock-gateway -o jsonpath='{.status.addresses[0].value}')
echo ${GATEWAY_ADDRESS}
  1. 从sleep应用中发起访问
kubectl exec deployment/sleep -it -- curl -X POST ${GATEWAY_ADDRESS}/v1/chat/completions \
  -H 'Content-Type: application/json' -H "host: example.com" -v -d '{
    "model": "mock",
    "max_completion_tokens": 100,
    "temperature": 0,
    "messages": [
      {
        "role": "user",
        "content": "<替换为任意违规内容>"
      }
    ]
}'

预期输出:

*   Trying 192.168.12.230:80...
* Connected to 192.168.12.230 (192.168.12.230) port 80
> POST /v1/chat/completions HTTP/1.1
> Host: example.com
> User-Agent: curl/8.8.0
> Accept: */*
> Content-Type: application/json
> Content-Length: 184
> 
* upload completely sent off: 184 bytes
< HTTP/1.1 200 OK
< date: Tue, 27 May 2025 08:21:37 GMT
< server: uvicorn
< content-length: 354
< content-type: application/json
< 
* Connection #0 to host 192.168.12.230 left intact
{"id": "chatcmpl-EhVEIn8VZAMbAUGyoXHZNltTFH417","object":"chat.completion","model":"from-security-guard","choices":[{"index":0,"message":{"role":"assistant","content":"作为人工智能,我不会对涉及色情、暴力、政治等敏感话题进行回答。如果您有其他问题需要帮助,可以继续提问。"},"logprobs":null,"finish_reason":"stop"}],"usage":{"prompt_tokens":0,"completion_tokens":0,"total_tokens":0}}
相关文章
|
29天前
|
Java 数据库连接 微服务
零基础自学 Java 全栈必备最全学习路线及知识清单方向指引
本文为零基础学习者提供完整的Java全栈学习路线,涵盖Java基础、进阶、框架、项目实战及拓展方向,助你系统掌握全栈开发技能,快速成长为优秀Java工程师。
187 7
|
27天前
|
运维 监控 测试技术
2025年微服务架构关键知识点(一):核心原则与演进趋势
微服务架构凭借其高可用性、灵活扩展等优势,已成为2025年主流软件开发范式。本文深入解析微服务的核心原则、演进趋势及实践要点,助力开发者夯实基础,应对挑战,构建高效、稳定的系统架构。
|
27天前
|
Linux 数据安全/隐私保护 虚拟化
【赵渝强老师】Docker的私有镜像仓库:Harbor
Harbor是由VMware开发的企业级Docker镜像仓库管理工具,支持权限管理、LDAP集成、日志审计、镜像复制及中文界面等功能。本文详细介绍了Harbor的安装、配置及在Docker中的实战应用流程,涵盖环境准备、部署步骤、基础操作和镜像上传等内容,适用于容器化应用的镜像管理场景。
167 4
|
19天前
|
存储 人工智能 Serverless
FunctionAI 图像生成:简化从灵感到 API 调用的每一步
FunctionAI 图像生成服务助力企业突破AI图像应用的三大难题:高成本算力、复杂运维与工程化壁垒。基于Serverless架构,提供从项目开发到API调用的全生命周期管理,支持ComfyUI、Stable Diffusion等主流工具,实现“一键部署、秒级调试、快速上线”。弹性伸缩、按需付费,大幅降低成本;国内网络加速、模型缓存、安全隔离,保障高效与稳定。让创意从灵感到生产无缝转化,真正驱动业务增长。
|
10天前
|
编解码 文字识别 自然语言处理
腾讯混元生图模型升级2.1版本:支持写字、2k分辨率,开源!
腾讯混元生图模型升级2.1版本:支持写字、2k分辨率,开源!
169 14
|
26天前
|
人工智能 弹性计算 自然语言处理
云速搭 AI 助理发布:对话式生成可部署的阿里云架构图
阿里云云速搭 CADT(Cloud Architect Design Tools)推出智能化升级——云小搭,一款基于大模型的 AI 云架构助手,致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。
360 31
|
25天前
|
NoSQL Java 关系型数据库
Java 从入门到进阶完整学习路线图规划与实战开发最佳实践指南
本文为Java开发者提供从入门到进阶的完整学习路线图,涵盖基础语法、面向对象、数据结构与算法、并发编程、JVM调优、主流框架(如Spring Boot)、数据库操作(MySQL、Redis)、微服务架构及云原生开发等内容,并结合实战案例与最佳实践,助力高效掌握Java核心技术。
202 1
|
1月前
|
消息中间件 Java 测试技术
RocketMQ-5.3.1异常、原因汇总表
本简介汇总了常见的RocketMQ异常信息及其解决方案,涵盖主题配置、网络通信、SSL设置、权限控制、消息发送与消费等多个方面,帮助开发者快速定位和理解异常原因。
188 26