Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

简介: Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

 

实例为从我文章中读取标题。

image.png

通过 class 属性锁定标题元素,把匹配的内容打印出来。

image.png

下面是源码:

package com.test.test;
import java.io.*;
import java.net.URL;
import java.net.URLConnection;
public class WebHtmlTest {
    public static void main(String[] args) throws IOException {
        /*
         作用:从url中读取web页面的内容
        */
        String html_url = "https://lanzao.blog.csdn.net/article/details/119329989";
        // 连接的超时时间
        System.setProperty("sun.net.client.defaultConnectTimeout", "20000");
        // 读取数据的超时时间
        System.setProperty("sun.net.client.defaultReadTimeout", "20000");
        try {
            URL url = new URL(html_url);
            URLConnection url_connection = url.openConnection();
            InputStream input_stream = url_connection.getInputStream();
            InputStreamReader input_stream_reader = new InputStreamReader(input_stream,"utf-8");
            BufferedReader html_reader = new BufferedReader(input_stream_reader);
            String html_reader_line = null;
            // 读取html内容
            while ((html_reader_line = html_reader.readLine()) != null) {
                if(html_reader_line.contains("class=\"title-article\"")) {
                    System.out.println(html_reader_line);
                }
            }
            // 关闭创建的对象
            html_reader.close();
            input_stream_reader.close();
            input_stream.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

喜欢的点个赞❤吧!

   

目录
相关文章
|
2天前
|
存储 缓存 前端开发
Servlet与JSP在Java Web应用中的性能调优策略
Servlet与JSP在Java Web应用中的性能调优策略
9 1
|
2天前
|
数据安全/隐私保护
自定义密码访问跳转页面HTML源码
自定义密码访问跳转页面HTML源码,源码由HTML+CSS+JS组成,记事本打开源码文件可以进行内容文字之类的修改,双击html文件可以本地运行效果,也可以上传到服务器里面,重定向这个界面
16 0
自定义密码访问跳转页面HTML源码
|
6天前
|
存储 移动开发 前端开发
HTML5时代来临,这些新特性你掌握了吗?一篇文章带你玩转Web前端技术潮流!
【8月更文挑战第26天】HTML5(简称H5)作为新一代Web标准,相比HTML4带来了诸多增强功能。
19 2
|
9天前
|
移动开发 HTML5
HTML5页面元素及属性
【8月更文挑战第23天】HTML5页面元素及属性。
23 4
|
7天前
|
安全 Java 应用服务中间件
【Azure 应用服务】App Service中,为Java应用配置自定义错误页面,禁用DELETE, PUT方法
【Azure 应用服务】App Service中,为Java应用配置自定义错误页面,禁用DELETE, PUT方法
【Azure 应用服务】App Service中,为Java应用配置自定义错误页面,禁用DELETE, PUT方法
|
9天前
|
XML JavaScript 测试技术
Web自动化测试框架(基础篇)--HTML页面元素和DOM对象
本文为Web自动化测试入门指南,介绍了HTML页面元素和DOM对象的基础知识,以及如何使用Python中的Selenium WebDriver进行元素定位、操作和等待机制,旨在帮助初学者理解Web自动化测试中的关键概念和操作技巧。
27 1
|
2天前
|
存储 Java 关系型数据库
基于Servlet和JSP的Java Web应用开发指南
基于Servlet和JSP的Java Web应用开发指南
6 0
|
7天前
|
XML 数据格式 开发者
|
7天前
|
移动开发 数据挖掘 API
HTML5 中 Web Workers API 的用法
【8月更文挑战第24天】
22 0
|
7天前
|
存储 移动开发 开发者
下一篇
云函数