本服务专为百炼平台用户提供,旨在提升大模型的文字输入和输出安全审核体验。在遵守百炼平台红线管控政策的基础上,我们提供了灵活的审核标签管理功能,允许用户根据需要开启或关闭特定审核标签。此外,我们还提供定制化的安全策略配置服务,以满足不同用户的个性化需求。
Tips1:立即开通AI安全护栏服务
点击开通服务,即可通过百炼便捷调用AI安全护栏产品服务。
Tips2:在百炼平台授权调用AI安全护栏服务
您需要在百炼平台访问全局设置页面。
点击去授权,进行相关授权。
Tips3:在调用百炼的header中传入相关标识。
调用阿里云百炼时,在请求头header设置以下参数,接入AI安全护栏审核服务。
{
"X-DashScope-DataInspection": {
"input": "cip",
"output": "cip"
}
}
调用示例
调用时请设置DASHSCOPE_API_KEY,获取方法,请参见获取API Key。
当前仅支持python SDK和HTTP 调用。
响应示例
错误信息:Error code: 400 - {
'error': {
'code': 'data_inspection_failed',
'param': None,
'message': 'Output data may contain inappropriate content.',
'type': 'data_inspection_failed'},
'id': 'chatcmpl-05411833-0206-9e36-b9e4-xxxxxxxxxxxxxxx',
'request_id': '05411833-0206-9e36-b9e4-xxxxxxxxxxxx'}
基于模型匹配策略
计费说明
按token数量后付费
当您在百炼控制台开通AI安全护栏产品的SLR授权后,并在调用百炼的header中传入cip标识时,我们会根据您的模型版本自动匹配服务于该模型的内容安全服务,具体匹配逻辑如下:
风险标签
标签含义
您可以在防护配置 > 检测项配置页签,在操作列单击管理获取每个服务支持的标签及其细分检测范围信息。以下是风险标签值、对应的分值区间以及对应的含义:
管理标签
除了部分红线管控标签,其他风险标签均可以在控制台进行开关配置,部分风险标签会提供更细分检测范围的开关配置,具体参见:AI安全护栏产品控制台
在左侧导航栏,选择防护配置 > 检测项配置
以百炼输入内容安全护栏(bl_query_guard)为例,单击操作列管理。
选择需要调整的检测类型,以不良内容检测为例。
单击编辑进入编辑模式,修改对应检测状态。
单击保存,保存新配置的检测范围。新配置的检测范围约2~5分钟生效并应用于生产环境。
控制台操作
在AI安全护栏控制台,除了支持标签管理,还支持词库管理、检测结果查看等操作。