工作四年,关于过滤敏感词,我准备这样干

简介: 工作四年,关于过滤敏感词,我准备这样干

📆 业务场景

提交订单评价时需要对评价内容进行判断,如果出现敏感词则提示修改

🔊这不就是写一个敏感词的校验工具类吗,小问题,说干就干

🖥️业务梳理

  1. 将敏感词存入数据库或者文件中
  2. 读取文件或数据库中敏感词,循环遍历敏感词,判断评价内容中是否包含敏感词,包含则提示报错

📌小技巧

读取文件时不需要每次都读取,用一个静态代码块坐初始化,读取完毕后放入jvm缓存

//敏感词库 通过jvm缓存
    private static final Set<String> sensitiveWords = new HashSet<>();
static {
   
   
    //静态代码块加载敏感词库
    load();
}

📇完整代码

import lombok.extern.slf4j.Slf4j;
import org.springframework.util.CollectionUtils;

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Set;

/**
 * 敏感词工具类
 * @author woniu
 * 2023-11-09
 */
@Slf4j
public class SensitiveWordUtil {
   
   

    //敏感词库 通过jvm缓存
    private static final Set<String> sensitiveWords = new HashSet<>();

    static {
   
   
        //静态代码块加载敏感词库
        load();
    }

    /**
     * 从敏感文件中逐行读取,加载到敏感词 set中
     */
    public static void load() {
   
   
        if (CollectionUtils.isEmpty(sensitiveWords)) {
   
   
            InputStream in = SensitiveWordUtil.class.getResourceAsStream("/file/word.txt");
            try (BufferedReader reader = new BufferedReader(new InputStreamReader(in));){
   
   
                String line;
                //逐行读取文件
                while ((line = reader.readLine()) != null) {
   
   
                    sensitiveWords.add(line);
                }
            } catch (FileNotFoundException e) {
   
   
                log.error("读取敏感词库文件错误,文件不存在");
                throw new RuntimeException("读取敏感词库文件错误,文件不存在");
            } catch (IOException e) {
   
   
                log.error("读取敏感词库文件错误,io问题");
                throw new RuntimeException("读取敏感词库文件错误,io问题");
            }
        }
    }


    /**
     * 判断传入文本中是否包含敏感词
     * @param word
     * @return
     */
    public static void containsSensitiveWord(String word) {
   
   
        Iterator<String> iterator = sensitiveWords.iterator();
        while (iterator.hasNext()) {
   
   
            String sensitiveWord = iterator.next();
            if (word.contains(sensitiveWord)) {
   
   
                log.error("匹配到敏感词"+sensitiveWord);
                throw new RuntimeException("评价内容不符合规范,请检查");
            }
        }
    }


    public static void main(String[] args) {
   
   

        // boolean aa = containsSensitiveWord("转让");
        // boolean aa1 = containsSensitiveWord("转让");
        // boolean aa2 = containsSensitiveWord("转让");
        // boolean aa3 = containsSensitiveWord("转让");
        // boolean aa4 = containsSensitiveWord("转让");
    }


}

嗯,速度很快,可以下班了

image-20231109174535083

image-20231113113059583

image-20231109174655588

🖊️最后总结

🖲要熟练掌握技巧,一定多多练习:纸上得来终觉浅,绝知此事要躬行

胖奥特曼悠闲躺着

目录
相关文章
|
8月前
|
存储 数据安全/隐私保护 C++
【期末不挂科-C++考前速过系列P1】大二C++第1次过程考核(3道简述题&7道代码题)【解析,注释】
【期末不挂科-C++考前速过系列P1】大二C++第1次过程考核(3道简述题&7道代码题)【解析,注释】
|
8月前
|
数据库
个人日记系统,记录点滴小事,记录生活点点滴滴
个人日记系统,记录点滴小事,记录生活点点滴滴
57 0
|
8月前
|
存储 人工智能
近期复盘 | 想多了都是问题,想开了都是答案
近期复盘 | 想多了都是问题,想开了都是答案
|
前端开发 Shell 程序员
🙊整活向:定期给老板推送同事的代码量
总有领导想把公司往倒闭里整。但是每天推送每个人的代码量倒是挺有趣的,git log本身就自带这个功能,不来看看吗?
183 0
🙊整活向:定期给老板推送同事的代码量
网络工程项目报价单应该怎么写?记住这6个步骤准没错!
网络工程项目报价单应该怎么写?记住这6个步骤准没错!
334 0
Zp
|
XML 算法 IDE
提升:抛弃七条不良编码习惯
提升:抛弃七条不良编码习惯
Zp
132 0
|
SQL 安全 数据安全/隐私保护
|
开发框架 Java 测试技术
【测试基础】五、这样提bug单,开发小哥还会怼你么?
【测试基础】五、这样提bug单,开发小哥还会怼你么?
【测试基础】五、这样提bug单,开发小哥还会怼你么?
|
存储 Java 程序员
BeanDifinition(加几行代码,可以产出让队友几天也找不出的Bug)
前言 文本已收录至我的GitHub仓库,欢迎Star:github.com/bin39232820… 种一棵树最好的时间是十年前,其次是现在
200 0
|
运维 Kubernetes Cloud Native
一份不大的救命文档,一场时间与生死的接力
一份文档,能成为照亮黑暗的灯塔,打开一条求生通道。
996 0
一份不大的救命文档,一场时间与生死的接力