Java Socket编程 - 获取WEB站点主页信息

简介: 早就有想写一个Java Socket编程系列的文章,由于自己懒一直没动。决定从 今天开始,每周写一篇,从最简单的socket连接,到文件传输到协议实现,到 远程桌面控制,全面讲述Java socket编程的各个方面与各种技巧,从普通 socket到Java NIO。

早就有想写一个Java Socket编程系列的文章,由于自己懒一直没动。决定从

今天开始,每周写一篇,从最简单的socket连接,到文件传输到协议实现,到

远程桌面控制,全面讲述Java socket编程的各个方面与各种技巧,从普通

socket到Java NIO。


本文算是第一篇,简述如何通过Java Socket获取网站的主页内容其中包括

如何获取本地机器名与IP地址,如何建立一个socket连接到远程WEB站点

如何使用HTTP GET方法获取网站主页内容与HTTP响应头。程序运行结果:


从中我们可以知道csdn网站是基于什么语言开发,服务器是什么,版本是多少。

具体的做法请看源代码:

package com.gloomyfish.socket.tutorial.one;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.net.InetAddress;
import java.net.InetSocketAddress;
import java.net.Socket;
import java.net.SocketAddress;
import java.net.UnknownHostException;

public class HomePageVisitor {
	private Socket client;
	private SocketAddress address;
	public HomePageVisitor(String hostName, int port) throws UnknownHostException, IOException {
		client = new Socket();
		address = new InetSocketAddress(hostName, port);
	}
	// GET http://localhost:8080/blank/Welcome.do HTTP/1.1\r\n
	public void printHomePageInfo(String httpString)
	{
		try {
			// Get local host info
	        InetAddress inetAddress = InetAddress.getLocalHost();
	        System.out.println("Host Address = " + inetAddress.getHostAddress());
	        System.out.println("Hostname = " + inetAddress.getHostName());
	        
	        // visit the WEBSITE
			client.connect(address);
			BufferedWriter bufferedWriter = new BufferedWriter(new OutputStreamWriter(client.getOutputStream(), "UTF8"));
			bufferedWriter.write(httpString);
			
			// -- HTTP/1.1 400 Bad Request if not send \r\n
			bufferedWriter.write("\r\n");
			bufferedWriter.flush();
			System.out.println("http request send out");
			
			BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(client.getInputStream()));
			String content = null;
			while((content = bufferedReader.readLine()) != null) {
				if(getStatusCde(content) == 400) {
					System.err.println("HTTP/1.1 | HTTP/1.0 400 Bad Request");
					break;
				}
				System.out.println("response contect -->> " + content);
			}
		} catch(Exception e) {
			e.printStackTrace();
		}
		
	}
	
	/**
	 * <p> try to parse the HTTP response content</p>
	 * @param content
	 * @return status of HTTP
	 */
	private static int getStatusCde(String content) {
		int status = 200; // default OK response
		if(content == null || "".equals(content))
			return status;
		else if (!content.contains("HTTP/1.1")&& !content.contains("HTTP/1.0"))
			return status;
		else if(content.contains("400") && content.contains("HTTP/1.1")
				|| content.contains("HTTP/1.0")) {
			status = 400;
		}
		return status;
	}
	
	public static void main(String[] args) {
		try {
			HomePageVisitor httpVisitor = new HomePageVisitor("www.csdn.net", 80);
			httpVisitor.printHomePageInfo("GET http://www.csdn.net HTTP/1.0\r\n");
		} catch (UnknownHostException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}
如果使用了代理,在初始化Address时候使用HTTP代理的地址与端口

接口,其它不变,代理会自动转发HTTP GET请求。代码如下:

address = new InetSocketAddress(http_proxy, proxy_port)

目录
相关文章
|
3天前
|
前端开发 Java
Java高手都在用的秘籍:自定义异常,让错误信息说话!
Java高手都在用的秘籍:自定义异常,让错误信息说话!
14 1
|
7天前
|
Java Windows
【Azure Developer】Windows中通过pslist命令查看到Java进程和线程信息,但为什么和代码中打印出来的进程号不一致呢?
【Azure Developer】Windows中通过pslist命令查看到Java进程和线程信息,但为什么和代码中打印出来的进程号不一致呢?
|
9天前
|
Serverless 对象存储
现代化 Web 应用构建问题之配置Serverless Devs的秘钥信息如何解决
现代化 Web 应用构建问题之配置Serverless Devs的秘钥信息如何解决
17 1
|
17天前
|
数据采集 机器学习/深度学习 前端开发
Java爬虫中的数据清洗:去除无效信息的技巧
Java爬虫中的数据清洗:去除无效信息的技巧
|
17天前
|
存储 Java
数据结构中的哈希表(java实现)利用哈希表实现学生信息的存储
这篇文章通过Java代码示例展示了如何实现哈希表,包括定义结点类、链表类、数组存储多条链表,并使用简单的散列函数处理冲突,以及如何利用哈希表存储和查询学生信息。
数据结构中的哈希表(java实现)利用哈希表实现学生信息的存储
|
2月前
|
开发框架 NoSQL 前端开发
在Winform项目和Web API的.NetCore项目中使用Serilog 来记录日志信息
在Winform项目和Web API的.NetCore项目中使用Serilog 来记录日志信息
|
2月前
|
网络协议 开发者 Python
深度探索Python Socket编程:从理论到实践,进阶篇带你领略网络编程的魅力!
【7月更文挑战第25天】在网络编程中, Python Socket编程因灵活性强而广受青睐。本文采用问答形式深入探讨其进阶技巧。**问题一**: Socket编程基于TCP/IP,通过创建Socket对象实现通信,支持客户端和服务器间的数据交换。**问题二**: 提升并发处理能力的方法包括多线程(适用于I/O密集型任务)、多进程(绕过GIL限制)和异步IO(asyncio)。**问题三**: 提供了一个使用asyncio库实现的异步Socket服务器示例,展示如何接收及响应客户端消息。通过这些内容,希望能激发读者对网络编程的兴趣并引导进一步探索。
24 4
|
2月前
|
网络协议 Python
网络世界的建筑师:Python Socket编程基础与进阶,构建你的网络帝国!
【7月更文挑战第26天】在网络的数字宇宙中,Python Socket编程是开启网络世界大门的钥匙。本指南将引领你从基础到实战,成为网络世界的建筑师。
46 2
|
2月前
|
网络协议 程序员 视频直播
|
2月前
|
开发者 Python
Python Socket编程:不只是基础,更有进阶秘籍,让你的网络应用飞起来!
【7月更文挑战第25天】在网络应用蓬勃发展的数字时代,Python凭借其简洁的语法和强大的库支持成为开发高效应用的首选。本文通过实时聊天室案例,介绍了Python Socket编程的基础与进阶技巧,包括服务器与客户端的建立、数据交换等基础篇内容,以及使用多线程和异步IO提升性能的进阶篇。基础示例展示了服务器端监听连接请求、接收转发消息,客户端连接服务器并收发消息的过程。进阶部分讨论了如何利用Python的`threading`模块和`asyncio`库来处理多客户端连接,提高应用的并发处理能力和响应速度。掌握这些技能,能使开发者在网络编程领域更加游刃有余,构建出高性能的应用程序。
21 3
下一篇
云函数