如何获取html中的文本-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

如何获取html中的文本

a123456678 2016-07-12 15:53:24 1315
<html> 
<head>  
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">  
        <title>Dom遍历</title>  
    </head>  
    <body> 
 
           ####1
 
        <div id="frm0">  
           ####2
        <div id="frm1">  
            ####3
        <div id="frm2">  
     
        </div>  
            ####4
        </div>  
     
        </div>  
    </body>  
</html>

将####1、2、3、4...这些位置的文本单独提取出来,javascript可以么,或者有什么其他语言解析库支持

JavaScript 前端开发
分享到
取消 提交回答
全部回答(1)
  • a123456678
    2019-07-17 19:55:06
    jsoup提供了传统的DOM 方式的元素解析,下面是个例子:
    File input = new File("D:/test.html");
    Document doc = Jsoup.parse(input, "UTF-8","网址/");
    Element content =doc.getElementById("content");
    Elements links = content.getElementsByTag("a");
    for (Element link : links) {
    String linkHref =link.attr("href");
    String linkText =link.text();
    }
    0 0
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

推荐文章
相似问题
推荐课程