HtmlUtil

简介: package com.css.common.util; import org.apache.commons.lang.StringUtils; import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.node

package com.css.common.util;

import org.apache.commons.lang.StringUtils;
import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.nodes.TagNode;
import org.htmlparser.nodes.TextNode;
import org.htmlparser.util.NodeList;
import org.htmlparser.util.ParserException;

/**
 * 用于格式化HTML的工具类
 *
 * @version 1.0
 *
 */
public class HtmlUtil {

 /**
  * @param args
  */
 public static void main(String[] args) {
  String html = "<FONT CLASS=\"FrameItemFont\"><A HREF=\"org/htmlparser/lexer/package-frame.html\" target=\"packageFrame\">org.htmlparser.lexer</A></FONT><BR><FONT CLASS=\"FrameItemFont\"><A HREF=\"org/htmlparser/lexerapplications/tabby/package-frame.html\" target=\"packageFrame\">org.htmlparser.lexerapplications.tabby</A></FONT><BR><FONT CLASS=\"FrameItemFont\"><A HREF=\"org/htmlparser/lexerapplications/thumbelina/package-frame.html\" target=\"packageFrame\">org.htmlparser.lexerapplications.thumbelina</A></FONT><BR><FONT CLASS=\"FrameItemFont\"><A HREF=\"org/htmlparser/nodes/package-frame.html\" target=\"packageFrame\">org.htmlparser.nodes</A></FONT>";
  int pre_length = 150;
  String preview = preview(html, pre_length);
  System.out.println(html);
  System.out.println(html.substring(0, pre_length));
  System.out.println(preview);
 }

 private final static NodeFilter nfilter = new NodeFilter(){
  public boolean accept(Node arg0) {
   return true;
  }};
  
 /**
  * 生成预览内容
  * @param html
  * @param max_count
  * @return
  */
 public static String preview(String html, int max_count){
  if(html.length()<= max_count * 1.1)
   return html;
  Parser parser = new Parser();
  StringBuffer prvContent = new StringBuffer();
  try {
   parser.setEncoding("8859_1");
   parser.setInputHTML(html);
   NodeList nodes = parser.extractAllNodesThatMatch(nfilter);
   Node node = null;
   for(int i=0;i<nodes.size();i++){
    if(prvContent.length() >= max_count){
     if(node instanceof TagNode){
      TagNode tmp_node = (TagNode)node;
      boolean isEnd = tmp_node.isEndTag();
      if(!isEnd){
       prvContent.setLength(prvContent.length()-tmp_node.getText().length()-2);
      }
     }
     //补齐所有未关闭的标签
     Node parent = node;
     //System.out.println("current node is . "+parent.getText());
     do{
      parent = parent.getParent(); 
      //System.out.println("parent = "+parent);     
      if(parent==null) break;
      if(!(parent instanceof TagNode)) continue;
      //System.out.println("Parent node is no ended. "+parent.getText());
      prvContent.append(((TagNode)parent).getEndTag().toHtml());
     }while(true);
     break;
    }
    node = nodes.elementAt(i);
    if(node instanceof TagNode){
     TagNode tag = (TagNode)node;
     prvContent.append('<');
     prvContent.append(tag.getText());
     prvContent.append('>');
     //System.out.println("TAG: " + '<'+tag.getText()+'>');
    }
    else if(node instanceof TextNode){
     int space = max_count - prvContent.length();
     if(space > 10){
      TextNode text = (TextNode)node;
      if(text.getText().length() < 10)
       prvContent.append(text.getText());
      else
       prvContent.append(StringUtils.abbreviate(text.getText(), max_count - prvContent.length()));
      //System.out.println("TEXT: " + text.getText());
     }
    }
   }
   return prvContent.toString();
  } catch (ParserException e) {
   e.printStackTrace();
  }finally{
   parser = null;
  }
  return html;
 }
 
}

目录
相关文章
|
7月前
|
SQL 人工智能 算法
【SQL server】玩转SQL server数据库:第二章 关系数据库
【SQL server】玩转SQL server数据库:第二章 关系数据库
169 10
|
小程序 数据处理
主流测绘仪器以及数据后处理软件教程
主流测绘仪器以及数据后处理软件教程
265 1
|
计算机视觉
OpenCV-通道合并cv::merge
OpenCV-通道合并cv::merge
167 0
|
SQL 存储 Java
应用成本低出 N 倍的数据分析引擎 esProc SPL
我们介绍的 esProc SPL 是一个数据分析引擎,具备 4 个主要特点:低代码、高性能、轻量级、全功能。SPL 不仅写得简单,跑得也更快,既可以独立使用还能与应用集成嵌入,同时适用于多种应用场景。使用 esProc SPL 实现数据分析业务,整体应用成本将比以 SQL 为代表的传统技术低出几倍。
|
4月前
|
机器学习/深度学习 人工智能 算法
软件测试的未来:AI与自动化的融合之路
随着技术的不断进步,人工智能(AI)和自动化技术在软件测试领域的应用日益增多。本文将探讨AI如何改变软件测试的面貌,以及自动化工具如何助力提升测试效率和准确性。我们将从实际案例出发,分析AI和自动化技术带来的优势与挑战,并展望未来软件测试的发展趋势。
|
7月前
|
安全 Swift
在Swift中,解包
在Swift中,解包
213 3
|
7月前
|
数据采集 数据可视化 数据挖掘
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
250 0
|
JSON 网络协议 Unix
iPerf3 命令通用选项
iPerf3 命令通用选项
136 0
|
存储 监控 IDE
【SpringCloud技术专题】「Resilience4j入门指南」(1)轻量级熔断框架的入门指南
【SpringCloud技术专题】「Resilience4j入门指南」(1)轻量级熔断框架的入门指南
545 0
【SpringCloud技术专题】「Resilience4j入门指南」(1)轻量级熔断框架的入门指南
|
缓存 网络安全 开发工具
Mac/Windows Git配置SSH和Git常用命令及iTerm2使用技巧
Mac/Windows Git配置SSH和Git常用命令及iTerm2使用技巧
353 0