HtmlCleaner2.0

简介: HtmlCleaner2.0 HtmlCleaner是一个Java库,用于安全地解析和转换Web上的任何HTML页面为良好定义的XML。它设计的非常小、快速、灵活和独立。
HtmlCleaner2.0

HtmlCleaner是一个Java库,用于安全地解析和转换Web上的任何HTML页面为良好定义的XML。它设计的非常小、快速、灵活和独立。


HtmlCleaner可以用在Java代码中,作为命令行工具或Ant任务。其解析的结果是轻量级的DOM,能轻易地转换成类似DOM或JDOM的标准,或以各种方式(紧凑格式,美观格式等)序列化为XML输出。


新版本的重大改进:
1)HtmlCleaner的DOM现在有大量的操纵节点和属性的方法,易于在序列化前进行搜索或修改。
2)HtmlCleaner DOM支持基本的XPath。
3)创建定制标签集和规则现在比使用XML配置文件更容易。
4)很多Bug和API改进。
目录
相关文章
|
6月前
|
Cloud Native 测试技术 数据安全/隐私保护
云原生之使用Docker部署Teedy轻量级文档管理系统
【5月更文挑战第8天】云原生之使用Docker部署Teedy轻量级文档管理系统
214 2
|
6月前
|
SQL API 索引
Superset对接ElasticSearch服务展示
Superset对接ElasticSearch服务展示
497 2
|
域名解析 jenkins Java
Jenkins的安装与升级
Jenkins的安装与升级
354 0
|
JSON API 数据格式
4. JSON字符串是如何被解析的?JsonParser了解一下(下)
4. JSON字符串是如何被解析的?JsonParser了解一下(下)
|
3月前
|
SQL 自然语言处理 关系型数据库
在 Postgres 中使用 Concat
【8月更文挑战第11天】
305 1
|
11月前
|
XML 分布式计算 Hadoop
hadoop
hadoop
1082 0
|
5月前
|
Java
springboot集成swagger2并分组全局设置Authorization
springboot集成swagger2并分组全局设置Authorization
176 0
|
Windows
代码签名证书如何申请
代码签名证书如何申请
204 0
|
6月前
|
存储 缓存 安全
Guava:Java开发者的全方位工具库
Guava:Java开发者的全方位工具库
219 0
|
消息中间件 监控 Java
Docker安装Kafka(docker-compose)、EFAK监控
Docker安装Kafka(docker-compose)、EFAK监控
Docker安装Kafka(docker-compose)、EFAK监控