NekoHTML 是一个基于Java的HTML扫描器和标签补全器
**NekoHTML** 是一个基于Java的HTML扫描器和标签补全器(tag balancer),由J. Andrew Clark开发。它主要用于解析HTML文档,并能够“修正”许多在编写HTML文档过程中常犯的错误,如增补缺失的父元素、自动用结束标签关闭相应的元素,以及处理不匹配的内嵌元素标签等。这使得程序能够以标准的XML接口来访问HTML文档中的信息。
### NekoHTML的主要特点包括:
1. **错误修正**:能够自动修正HTML中的常见错误,如未闭合的标签等。
2. **DOM树生成**:将HTML源代码转化为DOM(Document Object Model)结构,便