TinyHtmlParser开源喽~~~

简介:

优点:

高效、简单、易用的Html解析器。

学习时间,分分钟。

解析速度超过,查找速度超快,支持格式化。

有强悍的容错性,即使HTML标签不规范,也会尽可以进行匹配,弥补,正确纠错率达95%以上。即使不能正确纠错,也不会导致解析不下去。

支持大小写混合匹配,即开始标签与结束标签为<HTML>和</html>也可以正确的进行匹配。

Maven引用坐标:

1 <dependency>
2 <groupId>org.tinygroup</groupId>
3 <artifactId>htmlparser</artifactId>
4 <version>0.0.12</version>
5 </dependency>

使用方式,请参考http://my.oschina.net/tinyframework/blog/194574

只要把文中的Xml变成Html就完全适用。


相关文章
|
1月前
|
JSON 数据格式
LangChain-02 JsonOutputParser
LangChain-02 JsonOutputParser
25 2
|
2月前
|
编译器 API 开发工具
CMake构建学习笔记17-uriparser库的构建和使用
【9月更文挑战第15天】这是关于在 CMake 构建环境中构建与使用 uriparser 库的学习笔记。uriparser 是一个用于解析和处理 URI 的 C 语言库,提供高效准确的方法来解析和操作 URI。笔记详细介绍了获取源码、创建 CMake 项目结构、编写 `CMakeLists.txt`、构建项目以及在代码中包含头文件并解析 URI 的步骤。同时,还提醒了错误处理、平台兼容性和参考文档等注意事项,帮助开发者更好地理解和使用该库。
|
Python
Python参数解析工具argparse.ArgumentParser()
Python参数解析工具argparse.ArgumentParser()
GuessedAtParserWarning: No parser was explicitly specified,
GuessedAtParserWarning 一、问题描述 二、错误分析 二、解决方案
420 0
GuessedAtParserWarning: No parser was explicitly specified,
X-Pack Spark用户手册
概述 Spark是大数据平台的通用计算平台,应用非常广泛。本文主要介绍Spark相关的知识,主要包括:了解Spark,使用Spark,使用Spark过程中遇到的问题FAQ等,谨帮助用户快速的掌握Spark以及如何使用Spark。
3306 0
|
分布式计算 分布式数据库 Spark
X-Pack Spark使用[FAQ]
概述 本文主要列出在使用X-Pack Spark的FAQ。 Spark Connectors 主要列举Spark 对接其它数据源遇到的问题 Spark on HBase Spark on HBase Connector:如何在Spark侧设置HBase参数。
2339 0
|
机器学习/深度学习 Python
Python ConfigParser
ConfigParser 在深度学习中,我打算用这个类来处理参数文件,xx.ini或者xx.cfg。 一、基本操作 1、基本的读取配置文件 read(filename) - 直接读取ini,cfg文件内容 se...
1268 0
|
前端开发 容器 JavaScript
SpringMVC之分析AnnotationDrivenBeanDefinitionParser(三)
我们在之前的文章中对这篇文章中AnnotationDrivenBeanDefinitionParser的parse方法进行了一些分析,我们在这篇文章中接着分析AnnotationDrivenBeanDefinitionParser的parse方法的内容。
1251 0