java 过滤HTML标签

简介:

Java如何过滤掉HTML标签呢?

java过滤html标记   java删除html标签

Java代码   收藏代码
  1. /** 
  2.      * 删除input字符串中的html格式 
  3.      *  
  4.      * @param input 
  5.      * @param length 
  6.      *            显示的字符的个数 
  7.      * @return 
  8.      */  
  9.     public static String splitAndFilterString(String input, int length) {  
  10.         if (input == null || input.trim().equals("")) {  
  11.             return "";  
  12.         }  
  13.         // 去掉所有html元素,  
  14.         String str = input.replaceAll("\\&[a-zA-Z]{1,10};""").replaceAll(  
  15.                 "<[^>]*>""");  
  16.         str = str.replaceAll("[(/>)<]""").trim();  
  17.         str=SystemHWUtil.deleteAllCRLF(str);//delete all CRLF  
  18.         int len = str.length();  
  19.         if (length==SystemHWUtil.NEGATIVE_ONE|| len <= length) {  
  20.             return str;  
  21.         } else {  
  22.             str = str.substring(0, length);  
  23.             str += "......";  
  24.         }  
  25.         return str;  
  26.     }  
  27.   
  28.     /** 
  29.      * 返回纯文本,去掉html的所有标签,并且去掉空行 
  30.      *  
  31.      * @param input 
  32.      * @return 
  33.      */  
  34.     public static String splitAndFilterString(String input) {  
  35.         if (input == null || input.trim().equals("")) {  
  36.             return "";  
  37.         }  
  38.         // 去掉所有html元素,  
  39.         String str = input.replaceAll("\\&[a-zA-Z]{1,10};""").replaceAll(  
  40.                 "<[^>]*>""");  
  41.         str = str.replaceAll("[(/>)<]""");  
  42.         return SystemHWUtil.deleteCRLF(str);  
  43.     }  

 应用:

Java代码   收藏代码
  1. paperNews.setSplitAndFilterString(SystemHWUtil.splitAndFilterString(paperNews.getContent(), 120/*TODO */));  
  2.   
  3. ring content=paperNews.getContent();  
  4.     paperNews.setContent(SystemHWUtil.splitAndFilterString(content, DictionaryParam.getInt("news_settings""content_max")));  
  5.       
相关文章
|
1月前
|
移动开发 HTML5
HTML5标签的类型
HTML5标签的类型。
54 5
|
3月前
|
Java 开发者 UED
【实战宝典】Java异常处理大师级教程:throws关键字,让异常声明成为你的专属标签!
【实战宝典】Java异常处理大师级教程:throws关键字,让异常声明成为你的专属标签!
59 3
|
14天前
|
移动开发 编解码 UED
除了 `<audio>` 和 `<video>` 标签,HTML5 还支持哪些多媒体格式?
【10月更文挑战第19天】HTML5对多种多媒体格式的支持,为网页开发者提供了丰富的选择,能够更好地满足不同类型多媒体内容在网页中的展示和交互需求,提升了网页的用户体验和多媒体应用的多样性。
|
14天前
|
存储 移动开发 前端开发
|
1月前
|
前端开发
【HTML】img标签和超链接标签
【HTML】img标签和超链接标签
40 2
|
1月前
|
移动开发 前端开发 JavaScript
【HTML】HTML页面和常见标签
【HTML】HTML页面和常见标签
33 1
|
2月前
|
前端开发
前端基础(二)_HTML常用标签(块级标签、行级标签、行块级标签)
本文详细介绍了HTML中的常用标签,包括块级标签(如`h1`至`h6`、`p`、`div`等)、行级标签(如`span`、`b`、`strong`、`i`、`em`、`sub`、`sup`、`del`、`a`等),以及行块级标签(如`img`)。文章解释了这些标签的用途、特点和基本用法,并通过示例代码展示了如何在HTML文档中使用它们。
111 1
|
2月前
|
移动开发 开发者 UED
HTML5中video标签controlslist属性的使用方法
`controlsList`属性为开发者提供了更多控制HTML5视频播放器行为的能力,让视频内容的集成更加灵活和符合需求。通过精心设计的控制列表,可以提升用户体验,同时保持内容的安全性和专业性。这种细节的控制和定制能力是现代Web开发的一个重要方面,反映了HTML5对开发者和内容创作者需求的响应。
230 1
|
2月前
|
存储 JavaScript Java
使用NekoHTML解析HTML并提取META标签内容
关于NekoHTML的代码样例,这里提供一个简单的示例,用于展示如何使用NekoHTML来解析HTML文档并提取其中的信息。请注意,由于NekoHTML的具体实现和API可能会随着版本更新而有所变化,以下代码仅供参考。 ### 示例:使用NekoHTML解析HTML并提取META标签内容 ```java import org.cyberneko.html.parsers.DOMParser; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NodeList; import org.xml
|
2月前
|
XML JavaScript Java
NekoHTML 是一个基于Java的HTML扫描器和标签补全器
**NekoHTML** 是一个基于Java的HTML扫描器和标签补全器(tag balancer),由J. Andrew Clark开发。它主要用于解析HTML文档,并能够“修正”许多在编写HTML文档过程中常犯的错误,如增补缺失的父元素、自动用结束标签关闭相应的元素,以及处理不匹配的内嵌元素标签等。这使得程序能够以标准的XML接口来访问HTML文档中的信息。 ### NekoHTML的主要特点包括: 1. **错误修正**:能够自动修正HTML中的常见错误,如未闭合的标签等。 2. **DOM树生成**:将HTML源代码转化为DOM(Document Object Model)结构,便

热门文章

最新文章