内容安全算法对比

简介: 内容安全(Content security)是信息安全的一个分支,其目的为识别、阻断不良信息传播,例如滥发电子消息(Spamming)、色情内容、犯罪内容、恐怖主义内容、政治敏感内容等。涉及技术包括自然语言处理、计算机视觉等,涉及内容包括文字、图片、音频、视频等。互联网数据爆炸式增长,充斥着大量不可控因素。内容安全机器审核已成为各大互联网公司内部主要的工具之一。

内容安全(Content security)是信息安全的一个分支,其目的为识别、阻断不良信息传播,例如滥发电子消息(Spamming)、色情内容、犯罪内容、恐怖主义内容、政治敏感内容等。涉及技术包括自然语言处理、计算机视觉等,涉及内容包括文字、图片、音频、视频等。互联网数据爆炸式增长,充斥着大量不可控因素。内容安全机器审核已成为各大互联网公司内部主要的工具之一。

内容安全特点
1.png

内容安全范围

2.png

内容算法架构

3.png

主流内容安全算法介绍

  • textcnn

4.png

  • swem

5.png

  • cnn_swem

6.png

  • SCLstm(LSTM Network Model Combining TextCNN And Swem)

7.png

  • 效果对比

8.png

  • Bert

9.png

  • Bert如何落地使用

Q:模型效果好,性能不能满足需求A:

(1)Cut Network:12层的必要性
(2)max_sen_length:512的必要性
(3)Bert Distill

基于transformer 结构蒸馏:减少transformer encoding 的层数和hidden size 大小,主要差异体现在loss 的设计。BERT-PKD 、DistilBERT、TinyBERT等。基于其它简单结构(CNN、BiLSTM )蒸馏。

  • Bert_distill

10.png

How to do?

Teacher model finetuning 
打标:train data (and unlabeled data ) 打标(soft label and hard label)
Distillation:硬标签和软标签联合训练,在student model 的基础上加一个soft label 的loss
function,loss = lambdahard_loss +(1-lambda)soft_loss使用蒸馏后的模型预测.

  • Bert_distill效果

    11.png

目录
相关文章
|
3月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
2967 166
|
3月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
1967 120
|
5月前
|
云安全 机器学习/深度学习 人工智能
阿里云安全Black Hat技术开源大揭秘,AI安全检测的工程化实践
阿里云安全 LLMDYara框架开源核心思路,赋能云安全产品!
2045 15
|
4月前
|
云安全 人工智能 自然语言处理
|
4月前
|
人工智能 安全
|
6月前
|
云安全 人工智能 安全
百万奖金,2025 阿里云「AI安全」全球挑战赛等你来!
百万奖金池,多赛道齐发,邀请你来战
1358 4
|
Cloud Native 数据库 对象存储
《阿里云产品四月刊》—内容安全 新功能
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
242 4
新版阿里云内容安全对接
新版阿里云内容安全对接
495 1

热门文章

最新文章