<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Dom遍历</title>
</head>
<body>
####1
<div id="frm0">
####2
<div id="frm1">
####3
<div id="frm2">
</div>
####4
</div>
</div>
</body>
</html>
将####1、2、3、4...这些位置的文本单独提取出来,javascript可以么,或者有什么其他语言解析库支持
jsoup提供了传统的DOM 方式的元素解析,下面是个例子:
File input = new File("D:/test.html");
Document doc = Jsoup.parse(input, "UTF-8","网址/");
Element content =doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref =link.attr("href");
String linkText =link.text();
}
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。