Java 过滤html代码

简介:

(1)Java 如何escape HTML代码

如何转义HTML标签

Java代码   收藏代码
  1. /** 
  2.      * 去除HTML字串中的控制字符及不可视字符 
  3.      *  
  4.      * @param str 
  5.      *            HTML字串 
  6.      * @return 返回的字串 
  7.      */  
  8.     public static String escapeHTML(String str) {  
  9.         int length = str.length();  
  10.         int newLength = length;  
  11.         boolean someCharacterEscaped = false;  
  12.         for (int i = 0; i < length; i++) {  
  13.             char c = str.charAt(i);  
  14.             int cint = 0xffff & c;  
  15.             if (cint < 32)  
  16.                 switch (c) {  
  17.                 case 11:  
  18.                 default:  
  19.                     newLength--;  
  20.                     someCharacterEscaped = true;  
  21.                     break;  
  22.   
  23.                 case '\t':  
  24.                 case '\n':  
  25.                 case '\f':  
  26.                 case '\r':  
  27.                     break;  
  28.                 }  
  29.             else  
  30.                 switch (c) {  
  31.                 case '"':  
  32.                     newLength += 5;  
  33.                     someCharacterEscaped = true;  
  34.                     break;  
  35.   
  36.                 case '&':  
  37.                 case '\'':  
  38.                     newLength += 4;  
  39.                     someCharacterEscaped = true;  
  40.                     break;  
  41.   
  42.                 case '<':  
  43.                 case '>':  
  44.                     newLength += 3;  
  45.                     someCharacterEscaped = true;  
  46.                     break;  
  47.                 }  
  48.         }  
  49.         if (!someCharacterEscaped)  
  50.             return str;  
  51.   
  52.         StringBuffer sb = new StringBuffer(newLength);  
  53.         for (int i = 0; i < length; i++) {  
  54.             char c = str.charAt(i);  
  55.             int cint = 0xffff & c;  
  56.             if (cint < 32)  
  57.                 switch (c) {  
  58.                 case '\t':  
  59.                 case '\n':  
  60.                 case '\f':  
  61.                 case '\r':  
  62.                     sb.append(c);  
  63.                     break;  
  64.                 }  
  65.             else  
  66.                 switch (c) {  
  67.                 case '"':  
  68.                     sb.append("&quot;");  
  69.                     break;  
  70.   
  71.                 case '\'':  
  72.                     sb.append("&apos;");  
  73.                     break;  
  74.   
  75.                 case '&':  
  76.                     sb.append("&amp;");  
  77.                     break;  
  78.   
  79.                 case '<':  
  80.                     sb.append("&lt;");  
  81.                     break;  
  82.   
  83.                 case '>':  
  84.                     sb.append("&gt;");  
  85.                     break;  
  86.   
  87.                 default:  
  88.                     sb.append(c);  
  89.                     break;  
  90.                 }  
  91.         }  
  92.         return sb.toString();  
  93.     }  

 测试:

Java代码   收藏代码
  1. @Test  
  2.     public void test_001(){  
  3.   
  4.         String input="<html><input type=\"button\" onlick=\"abc()\" > </html>";  
  5.         System.out.println(input);  
  6.         System.out.println(StringUtil.escapeHTML(input));  
  7.     }  

 运行结果:

 

 

(2)java 如何去除html标签,只留下文本

Java代码   收藏代码
  1. /** 
  2.      * 删除input字符串中的html格式 
  3.      *  
  4.      * @param input 
  5.      * @param length 
  6.      *            显示的字符的个数 
  7.      * @return 
  8.      */  
  9.     public static String splitAndFilterString(String input, int length) {  
  10.         if (input == null || input.trim().equals("")) {  
  11.             return "";  
  12.         }  
  13.         // 去掉所有html元素,  
  14.         String str = input.replaceAll("\\&[a-zA-Z]{1,10};""").replaceAll(  
  15.                 "<[^>]*>""");  
  16.         str = str.replaceAll("[(/>)<]""");  
  17.         int len = str.length();  
  18.         if (len <= length) {  
  19.             return str;  
  20.         } else {  
  21.             str = str.substring(0, length);  
  22.             str += "......";  
  23.         }  
  24.         return str;  
  25.     }  
  26.   
  27.     /** 
  28.      * 返回纯文本,去掉html的所有标签,并且去掉空行 
  29.      *  
  30.      * @param input 
  31.      * @return 
  32.      */  
  33.     public static String splitAndFilterString(String input) {  
  34.         if (input == null || input.trim().equals("")) {  
  35.             return "";  
  36.         }  
  37.         // 去掉所有html元素,  
  38.         String str = input.replaceAll("\\&[a-zA-Z]{1,10};""").replaceAll(  
  39.                 "<[^>]*>""");  
  40.         str = str.replaceAll("[(/>)<]""");  
  41.         return SystemHWUtil.deleteCRLF(str);  
  42.     }  
  43.   
  44. /*** 
  45.      * Delete all spaces 
  46.      *  
  47.      * @param input 
  48.      * @return 
  49.      */  
  50.     public static String deleteAllCRLF(String input) {  
  51.         return input.replaceAll("((\r\n)|\n)[\\s\t ]*""").replaceAll(  
  52.                 "^((\r\n)|\n)""");  
  53.     }  
  54.   
  55.     /** 
  56.      * delete CRLF; delete empty line ;delete blank lines 
  57.      *  
  58.      * @param input 
  59.      * @return 
  60.      */  
  61.     public static String deleteCRLF(String input) {  
  62.         input = SystemHWUtil.deleteCRLFOnce(input);  
  63.         return SystemHWUtil.deleteCRLFOnce(input);  
  64.     }  


相关文章
|
4天前
|
Java
在 Java 中捕获和处理自定义异常的代码示例
本文提供了一个 Java 代码示例,展示了如何捕获和处理自定义异常。通过创建自定义异常类并使用 try-catch 语句,可以更灵活地处理程序中的错误情况。
|
25天前
|
存储 安全 Java
Java Map新玩法:探索HashMap和TreeMap的高级特性,让你的代码更强大!
【10月更文挑战第17天】Java Map新玩法:探索HashMap和TreeMap的高级特性,让你的代码更强大!
50 2
|
25天前
|
存储 Java API
键值对魔法:如何优雅地使用Java Map,让代码更简洁?
键值对魔法:如何优雅地使用Java Map,让代码更简洁?
101 2
|
1月前
|
安全 Java API
Java 17新特性让你的代码起飞!
【10月更文挑战第4天】自Java 8发布以来,Java语言经历了多次重大更新,每一次都引入了令人兴奋的新特性,极大地提升了开发效率和代码质量。本文将带你从Java 8一路走到Java 17,探索那些能让你的代码起飞的关键特性。
75 1
|
18天前
|
XML 安全 Java
Java反射机制:解锁代码的无限可能
Java 反射(Reflection)是Java 的特征之一,它允许程序在运行时动态地访问和操作类的信息,包括类的属性、方法和构造函数。 反射机制能够使程序具备更大的灵活性和扩展性
32 5
Java反射机制:解锁代码的无限可能
|
14天前
|
jenkins Java 测试技术
如何使用 Jenkins 自动发布 Java 代码,通过一个电商公司后端服务的实际案例详细说明
本文介绍了如何使用 Jenkins 自动发布 Java 代码,通过一个电商公司后端服务的实际案例,详细说明了从 Jenkins 安装配置到自动构建、测试和部署的全流程。文中还提供了一个 Jenkinsfile 示例,并分享了实践经验,强调了版本控制、自动化测试等关键点的重要性。
47 3
|
20天前
|
存储 安全 Java
系统安全架构的深度解析与实践:Java代码实现
【11月更文挑战第1天】系统安全架构是保护信息系统免受各种威胁和攻击的关键。作为系统架构师,设计一套完善的系统安全架构不仅需要对各种安全威胁有深入理解,还需要熟练掌握各种安全技术和工具。
57 10
|
15天前
|
分布式计算 Java MaxCompute
ODPS MR节点跑graph连通分量计算代码报错java heap space如何解决
任务启动命令:jar -resources odps-graph-connect-family-2.0-SNAPSHOT.jar -classpath ./odps-graph-connect-family-2.0-SNAPSHOT.jar ConnectFamily 若是设置参数该如何设置
|
14天前
|
Java
Java代码解释++i和i++的五个主要区别
本文介绍了前缀递增(++i)和后缀递增(i++)的区别。两者在独立语句中无差异,但在赋值表达式中,i++ 返回原值,++i 返回新值;在复杂表达式中计算顺序不同;在循环中虽结果相同但使用方式有别。最后通过 `Counter` 类模拟了两者的内部实现原理。
Java代码解释++i和i++的五个主要区别
|
19天前
|
JSON 移动开发 数据格式
html5+css3+js移动端带歌词音乐播放器代码
音乐播放器特效是一款html5+css3+js制作的手机移动端音乐播放器代码,带歌词显示。包括支持单曲循环,歌词显示,歌曲搜索,音量控制,列表循环等功能。利用json获取音乐歌单和歌词,基于html5 audio属性手机音乐播放器代码。
69 6