Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

简介: Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

 

实例为从我文章中读取标题。

image.png

通过 class 属性锁定标题元素,把匹配的内容打印出来。

image.png

下面是源码:

package com.test.test;
import java.io.*;
import java.net.URL;
import java.net.URLConnection;
public class WebHtmlTest {
    public static void main(String[] args) throws IOException {
        /*
         作用:从url中读取web页面的内容
        */
        String html_url = "https://lanzao.blog.csdn.net/article/details/119329989";
        // 连接的超时时间
        System.setProperty("sun.net.client.defaultConnectTimeout", "20000");
        // 读取数据的超时时间
        System.setProperty("sun.net.client.defaultReadTimeout", "20000");
        try {
            URL url = new URL(html_url);
            URLConnection url_connection = url.openConnection();
            InputStream input_stream = url_connection.getInputStream();
            InputStreamReader input_stream_reader = new InputStreamReader(input_stream,"utf-8");
            BufferedReader html_reader = new BufferedReader(input_stream_reader);
            String html_reader_line = null;
            // 读取html内容
            while ((html_reader_line = html_reader.readLine()) != null) {
                if(html_reader_line.contains("class=\"title-article\"")) {
                    System.out.println(html_reader_line);
                }
            }
            // 关闭创建的对象
            html_reader.close();
            input_stream_reader.close();
            input_stream.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

喜欢的点个赞❤吧!

   

目录
相关文章
|
XML JSON API
ServiceStack:不仅仅是一个高性能Web API和微服务框架,更是一站式解决方案——深入解析其多协议支持及简便开发流程,带您体验前所未有的.NET开发效率革命
【10月更文挑战第9天】ServiceStack 是一个高性能的 Web API 和微服务框架,支持 JSON、XML、CSV 等多种数据格式。它简化了 .NET 应用的开发流程,提供了直观的 RESTful 服务构建方式。ServiceStack 支持高并发请求和复杂业务逻辑,安装简单,通过 NuGet 包管理器即可快速集成。示例代码展示了如何创建一个返回当前日期的简单服务,包括定义请求和响应 DTO、实现服务逻辑、配置路由和宿主。ServiceStack 还支持 WebSocket、SignalR 等实时通信协议,具备自动验证、自动过滤器等丰富功能,适合快速搭建高性能、可扩展的服务端应用。
1008 3
|
11月前
|
应用服务中间件 网络安全 数据安全/隐私保护
网关服务器配置指南:实现自动DHCP地址分配、HTTP服务和SSH无密码登录。
哇哈哈,道具都准备好了,咱们的魔术秀就要开始了。现在,你的网关服务器已经魔法满满,自动分配IP,提供网页服务,SSH登录如入无人之境。而整个世界,只会知道效果,不会知道是你在幕后操控一切。这就是真正的数字世界魔法师,随手拈来,手到擒来。
549 14
|
Go
在golang中发起http请求以获取访问域名的ip地址实例(使用net, httptrace库)
这只是追踪我们的行程的简单方法,不过希望你跟着探险家的脚步,即使是在互联网的隧道中,也可以找到你想去的地方。接下来就是你的探险之旅了,祝你好运!
636 26
|
缓存 网络协议 前端开发
Web 性能优化|了解 HTTP 协议后才能理解的预加载
本文旨在探讨和分享多种预加载技术及其在提升网站性能、优化用户体验方面的应用。
Web 性能优化|了解 HTTP 协议后才能理解的预加载
|
域名解析 缓存 网络协议
Web基础与HTTP协议
通过掌握这些基础知识和技术,开发者可以更加高效地构建和优化Web应用,提供更好的用户体验和系统性能。
417 15
|
安全 网络协议 算法
HTTPS网络通信协议揭秘:WEB网站安全的关键技术
HTTPS网络通信协议揭秘:WEB网站安全的关键技术
1290 4
HTTPS网络通信协议揭秘:WEB网站安全的关键技术
|
缓存 网络协议 前端开发
Web 性能优化|了解 HTTP 协议后才能理解的预加载
本文旨在探讨和分享多种预加载技术及其在提升网站性能、优化用户体验方面的应用。
HTML URL可以有多少种写法
URL有多种类型,包括绝对URL,其包含完整路径;相对URL,则基于当前文档位置。此外有协议相对URL,不指定协议;锚点URL用于定位页面内特定位置;邮政URL用于创建邮件链接;电话URL用于拨打电话;文件URL指向本地文件;数据URL则直接在HTML中嵌入小文件,如图片。
|
缓存 数据安全/隐私保护 UED
代理服务器在HTTP请求中的应用:Ruby实例
代理服务器在HTTP请求中的应用:Ruby实例
|
网络协议
Web基础与HTTP协议
【8月更文挑战第10天】
197 2

热门文章

最新文章