Java-jsoup-解析HTML

本文涉及的产品
云解析 DNS,旗舰版 1个月
云解析DNS,个人版 1个月
全局流量管理 GTM,标准版 1个月
简介:
+关注继续查看

/**
  * jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操    作数据。
  jsoup的主要功能如下:
   1. 从一个URL,文件或字符串中解析HTML; 
  2. 使用DOM或CSS选择器来查找、取出数据; 
  3. 可操作HTML元素、属性、文本; 
  jsoup是基于MIT协议发布的,可放心使用于商业项目。
  * */

 

在线Javadoc:http://www.ostools.net/apidocs/apidoc?api=jsoup-1.6.3

 

jsoup Cookbook(中文版):http://www.open-open.com/jsoup/

 

举个例子、:

这是一张表:





public static void main(String[] args) throws IOException {
    // TODO Auto-generated method stub
      Document doc = Jsoup.connect("http://localhost:8080/ReportSystem/upload/1374749451504.html").get();
        Elements datas = doc.getElementsByTag("table");
        for (Element data : datas) 
        {
            Elements trs=data.getElementsByTag("tr");
            for (int i = 0; i<trs.size(); i++) 
            {
                Elements tds = trs.get(i).getElementsByTag("td");
                for(int j = 0; j<tds.size(); j++){
                    if(!"".equals(tds.get(j).text())){
                        System.out.println(tds.get(j).text()+","+i+","+j);
                    }
                }
            }
        }
    }

 


相关文章
|
3天前
|
数据采集 JavaScript 小程序
laravel8(四)使用simple_html_dom库解析html
首先:simple_html_dom下载地址: github.com/samacs/simp… 这是一个PHP解析html的一个库。 这玩意还是很有用的,比如我们在使用PHP做爬虫的时候,需要解析html中的内容等。 他的强大之处不仅仅只是帮助我们验证html文档;更能解析不符合W3C标准的html文档。 关于如何引入第三方类库,请移步《laravel5.8(十)引入第三方类库》laravel8中的设置方法也大同小异。 一:加载 html 有三种方式调用这个类: 1. 从url中加载html文档 2. 从字符串中加载html文档 3. 从文件中加载html文档
19 1
|
1月前
|
数据采集 JavaScript 前端开发
Node.js 中的 HTML 解析:技巧和最佳实践
在 Web 开发中,解析 HTML 是一个常见的任务,特别是当我们需要从网页中提取数据或操作 DOM 时。掌握 Node.js 中解析 HTML 的各种方式,可以大大提高我们提取和处理网页数据的效率。本文将介绍如何在 Node.js 中解析 HTML。
|
2月前
|
XML 存储 JavaScript
XML与html解析,区别,如何使用
XML与html解析,区别,如何使用
|
2月前
|
机器学习/深度学习 数据采集 XML
使用BeautifulSoup解析豆瓣网站的HTML内容并查找图片链接
使用BeautifulSoup解析豆瓣网站的HTML内容并查找图片链接
|
2月前
|
存储 自然语言处理 JavaScript
【Vue2.0源码学习】模板编译篇-模板解析阶段(HTML解析器)
【Vue2.0源码学习】模板编译篇-模板解析阶段(HTML解析器)
17 0
|
3月前
|
Java Maven
在Java中,我们可以使用Jsoup库来解析和分析网页
在Java中,我们可以使用Jsoup库来解析和分析网页。以下是一个简单的示例,演示如何使用Jsoup库获取网页的标题
26 1
|
3月前
|
XML C语言 数据格式
七、使用BeautifulSoup4解析HTML实战(一)
七、使用BeautifulSoup4解析HTML实战(一)
|
5月前
|
移动开发 JavaScript 前端开发
Java使用Jsoup爬取数据
Java使用Jsoup爬取数据
57 0
|
6月前
|
数据采集 Web App开发 存储
Java爬虫第五篇:使用selenium、Jsoup 抓取bing搜索图片
Java爬虫第五篇:使用selenium、Jsoup 抓取bing搜索图片
130 0
|
6月前
|
数据采集 Web App开发 存储
Java爬虫第四篇:使用selenium、Jsoup 抓取图片
Java爬虫第四篇:使用selenium、Jsoup 抓取图片
135 0
相关产品
云迁移中心
推荐文章
更多
推荐镜像
更多