Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

简介: Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

 

实例为从我文章中读取标题。

image.png

通过 class 属性锁定标题元素,把匹配的内容打印出来。

image.png

下面是源码:

package com.test.test;
import java.io.*;
import java.net.URL;
import java.net.URLConnection;
public class WebHtmlTest {
    public static void main(String[] args) throws IOException {
        /*
         作用:从url中读取web页面的内容
        */
        String html_url = "https://lanzao.blog.csdn.net/article/details/119329989";
        // 连接的超时时间
        System.setProperty("sun.net.client.defaultConnectTimeout", "20000");
        // 读取数据的超时时间
        System.setProperty("sun.net.client.defaultReadTimeout", "20000");
        try {
            URL url = new URL(html_url);
            URLConnection url_connection = url.openConnection();
            InputStream input_stream = url_connection.getInputStream();
            InputStreamReader input_stream_reader = new InputStreamReader(input_stream,"utf-8");
            BufferedReader html_reader = new BufferedReader(input_stream_reader);
            String html_reader_line = null;
            // 读取html内容
            while ((html_reader_line = html_reader.readLine()) != null) {
                if(html_reader_line.contains("class=\"title-article\"")) {
                    System.out.println(html_reader_line);
                }
            }
            // 关闭创建的对象
            html_reader.close();
            input_stream_reader.close();
            input_stream.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

喜欢的点个赞❤吧!

   

目录
相关文章
|
2天前
|
Java 调度
Java中线程池的技术
Java中线程池的技术
16 3
|
3天前
|
Java 编译器 开发者
Java注解(Annotation)技术深入解析
Java注解(Annotation)技术深入解析
281 1
|
3天前
|
设计模式 算法 Java
Java语言中的接口技术深入解析
Java语言中的接口技术深入解析
170 0
|
3天前
|
Java
Java语言中的继承技术深入解析
Java语言中的继承技术深入解析
139 0
|
3天前
|
安全 Java
Java语言中的封装技术深入解析
Java语言中的封装技术深入解析
|
3天前
|
存储 Java
Java语言中的多态技术深入解析
Java语言中的多态技术深入解析
126 0
|
3天前
|
存储 Java
Java IO流:深入解析与技术应用
Java IO流:深入解析与技术应用
215 1
|
5天前
|
消息中间件 存储 Java
Java分布式技术面试总结(全面,实时更新)
Java分布式技术面试总结(全面,实时更新)
|
7天前
|
监控 NoSQL Java
java云MES 系统源码Java+ springboot+ mysql 一款基于云计算技术的企业级生产管理系统
MES系统是生产企业对制造执行系统实施的重点在智能制造执行管理领域,而MES系统特点中的可伸缩、信息精确、开放、承接、安全等也传递出:MES在此管理领域中无可替代的“王者之尊”。MES制造执行系统特点集可伸缩性、精确性、开放性、承接性、经济性与安全性于一体,帮助企业解决生产中遇到的实际问题,降低运营成本,快速适应企业不断的制造执行管理需求,使得企业已有基础设施与一切可用资源实现高度集成,提升企业投资的有效性。
49 5
|
9天前
|
监控 数据可视化 Java
【JAVA】分布式链路追踪技术概论
skywalking拥有更加的强大和细粒度的图形监控界面。
22 2