java.net.URLConnection类_java模拟浏览器

简介:

最近做个产品要用爬虫获得信息,可是这个网页要模拟浏览器输出,我参考了网上很多setRequestProperty里面User-Agent都写得Mozilla/5.0结果还是不能访问,最后研究了一下写出来了。

public static String URLPostConnReturnHtml(String ip){

URL url = null ;
HttpURLConnection conn = null ;
BufferedReader br = null ;
InputStreamReader isr = null ;
InputStream is = null ;
OutputStream os = null ;
OutputStreamWriter writer ;
int responseCode ;
String readerLine = "" ;
StringBuffer htmlCode = new StringBuffer() ;
String htmlCodeStr = "" ;
try {
url = new URL("http://www.yougetsignal.com/tools/whois-lookup/php/get-whois-lookup-json-data.php") ;
conn= (HttpURLConnection)url.openConnection() ;
conn.setConnectTimeout(TIME_OUT) ;
conn.setReadTimeout(TIME_OUT) ;
//设置可以输出
conn.setDoOutput(true) ;
//设置可以读取默认是true
conn.setDoInput(true) ;
//设置不适用缓存,因为我们的数据是实时更新的
conn.setUseCaches(false) ;
//设置请求方式为post,默认是get
conn.setRequestMethod("POST") ;
//设置所有的http连接自动处理重定向
HttpURLConnection.setFollowRedirects(true) ;
//设置本次连接自动处理重定向
conn.setInstanceFollowRedirects(true) ;
//模拟ios 谷歌浏览器访问
conn.setRequestProperty("User-Agent","Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11") ;
//conn.setRequestProperty("Content-Type", "application/x-www-form-urlencoded") ;

os = conn.getOutputStream() ;
writer = new OutputStreamWriter(os ,"utf-8") ;
writer.write("remoteAddress="+ip) ;
writer.flush() ;
writer.close() ;
responseCode= conn.getResponseCode() ;
//TODO:如果得到返回html代码,则读取
if(responseCode == 200){
is = conn.getInputStream() ;
isr = new InputStreamReader(is) ;
br = new BufferedReader(isr) ;
readerLine = br.readLine() ; 
while(readerLine != null){
htmlCode.append(readerLine) ;
readerLine = br.readLine() ;
}
}else{
System.out.println(errorResponseStr + responseCode);
}
htmlCodeStr = htmlCode.toString() ;
} catch (Exception e) {
e.printStackTrace() ;
RETRY_COUNT++;
System.out.println(errorNetConnStr + RETRY_COUNT);
if (RETRY_COUNT < RETRY_COUNT_BREAK) {
htmlCodeStr = URLPostConnReturnHtml(ip);
}else{
System.out.println("网络连接失败!");
}
}finally{
try {
if(br!=null){
br.close() ;
}
if(isr!=null){
isr.close() ;
}
if(isr!=null){
is.close() ;
}
if(os!=null){
os.close() ;
}
} catch (IOException e) {
// TODO Auto-generated catch block
System.out.println("IO流关闭错误--->");
e.printStackTrace();
}
if(conn!=null){
conn.disconnect() ;
}
}
System.out.println(htmlCodeStr);
return htmlCodeStr ;
}
目录
相关文章
|
4天前
|
存储 缓存 安全
java 中操作字符串都有哪些类,它们之间有什么区别
Java中操作字符串的类主要有String、StringBuilder和StringBuffer。String是不可变的,每次操作都会生成新对象;StringBuilder和StringBuffer都是可变的,但StringBuilder是非线程安全的,而StringBuffer是线程安全的,因此性能略低。
|
21天前
|
存储 安全 Java
java.util的Collections类
Collections 类位于 java.util 包下,提供了许多有用的对象和方法,来简化java中集合的创建、处理和多线程管理。掌握此类将非常有助于提升开发效率和维护代码的简洁性,同时对于程序的稳定性和安全性有大有帮助。
42 17
|
13天前
|
安全 Java
Java多线程集合类
本文介绍了Java中线程安全的问题及解决方案。通过示例代码展示了使用`CopyOnWriteArrayList`、`CopyOnWriteArraySet`和`ConcurrentHashMap`来解决多线程环境下集合操作的线程安全问题。这些类通过不同的机制确保了线程安全,提高了并发性能。
|
17天前
|
存储 Java 程序员
Java基础的灵魂——Object类方法详解(社招面试不踩坑)
本文介绍了Java中`Object`类的几个重要方法,包括`toString`、`equals`、`hashCode`、`finalize`、`clone`、`getClass`、`notify`和`wait`。这些方法是面试中的常考点,掌握它们有助于理解Java对象的行为和实现多线程编程。作者通过具体示例和应用场景,详细解析了每个方法的作用和重写技巧,帮助读者更好地应对面试和技术开发。
59 4
|
18天前
|
Java 编译器 开发者
Java异常处理的最佳实践,涵盖理解异常类体系、选择合适的异常类型、提供详细异常信息、合理使用try-catch和finally语句、使用try-with-resources、记录异常信息等方面
本文探讨了Java异常处理的最佳实践,涵盖理解异常类体系、选择合适的异常类型、提供详细异常信息、合理使用try-catch和finally语句、使用try-with-resources、记录异常信息等方面,帮助开发者提高代码质量和程序的健壮性。
38 2
|
22天前
|
存储 安全 Java
如何保证 Java 类文件的安全性?
Java类文件的安全性可以通过多种方式保障,如使用数字签名验证类文件的完整性和来源,利用安全管理器和安全策略限制类文件的权限,以及通过加密技术保护类文件在传输过程中的安全。
|
26天前
|
Java 数据格式 索引
使用 Java 字节码工具检查类文件完整性的原理是什么
Java字节码工具通过解析和分析类文件的字节码,检查其结构和内容是否符合Java虚拟机规范,确保类文件的完整性和合法性,防止恶意代码或损坏的类文件影响程序运行。
|
26天前
|
Java API Maven
如何使用 Java 字节码工具检查类文件的完整性
本文介绍如何利用Java字节码工具来检测类文件的完整性和有效性,确保类文件未被篡改或损坏,适用于开发和维护阶段的代码质量控制。
|
26天前
|
存储 Java 编译器
java wrapper是什么类
【10月更文挑战第16天】
30 3
|
29天前
|
Java 程序员 测试技术
Java|让 JUnit4 测试类自动注入 logger 和被测 Service
本文介绍如何通过自定义 IDEA 的 JUnit4 Test Class 模板,实现生成测试类时自动注入 logger 和被测 Service。
23 5
下一篇
无影云桌面