使用正则表达式和REPLACE,SPLIT获得7,8,9天单个城市天气情况抓取解析代码

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介:

代码写的很凌乱,正则用得也不是很好,不过还是实现了功能,贴出代码


package com.zzk.cn;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class TestSpider {

	public static void main(String[] args) {
		URL url = null;
		URLConnection conn = null;
		InputStream in = null;
		InputStreamReader isr = null;
		BufferedReader br = null;
		try {
			url = new URL("http://www.haotq.com/d_anqing.html");
			conn = url.openConnection();
			in = conn.getInputStream();
			isr = new InputStreamReader(in);
			br = new BufferedReader(isr);
			String line = "";
			String info="";
			while (null != (line = br.readLine())) {
				//System.out.println(line);
				info+=line;
			}
		
			//System.out.println(info);
			Pattern p=Pattern.compile("div\\sid=.weather_day_brief.*?</div>");//正则获取网页大致信息

			Matcher m=p.matcher(info);
			String s1="";
	    	while(m.find()) {
	    		s1=m.group();
	    		//System.out.println(s1);
	    	}
	    	
	    	String s2="";
	        Pattern p1=Pattern.compile("<br>.*<script");//正则根据br获取7,8,9天的天气信息
	    	//Pattern p1=Pattern.compile("<(/?\\s?br\\b)>");
	    	Matcher m1=p1.matcher(s1);
	    	while(m1.find()) {
	    		//System.out.println(m1.group());
	    	    s2=m1.group();
	    	}
			
	    	String[] sPlit=s2.split("<br>"); 

	    	int i=s2.length(); 
	    		String t1="";
	    		String t2="";
	    		String t3="";
	    		t1=sPlit[7];
	    		t2=sPlit[8];
	    		t3=sPlit[9];
	    		System.out.println(t1);//7天后天气
	    		System.out.println(t2);//8天后天气
	    		System.out.println(t3);//9天后天气
	    	
	    	
	    		//天气
	    	String[] sPlit1=t1.split(" "); 
	    	int i1=t1.length();
	    	System.out.println(sPlit1[1]);//白天阵雨,夜间阵雨,
	    	System.out.println(sPlit1[2]);//气温2℃~9℃
	    	System.out.println(sPlit1[3]);//北偏东风 二级
	    	
	    	String w1="";
	    	String w2="";
	    	String w3="";
	    	w1=sPlit1[1];
	    	String[] sPlit4=w1.split(",");
	    	String weather_title71=sPlit4[0].replace("白天", "");//第七天的白天的字段
	    	String weather_title72=sPlit4[1].replace("夜间", "");//第七天的夜晚的字段
            System.out.println(weather_title71);//第七天的白天天气情况
            System.out.println(weather_title72);//第七天的夜晚天气情况
	    	
	    	w2=sPlit1[2];
	    	String[] sPlit5=w2.split("~");
	    	String weather_temp71=sPlit5[0].replace("气温", "");
	    	String weather_temp72=sPlit5[1].replace("~", "").replace(",", "");
	    	System.out.println(weather_temp71);//第七天的最低气温
	    	System.out.println(weather_temp72);//第七天的最高气温
	    	
	    	w3=sPlit1[3];
	    	String[] sPlit6=w3.split(" ");
	    	String weather_winddirection71=sPlit6[0];
	    	String weather_windpower71=sPlit6[1];
	    	System.out.println(weather_winddirection71);//第七天的风向
	    	System.out.println(weather_windpower71);//第七天的风力
	    	
	    	String[] sPlit2=t2.split(" "); 
	    	int i2=t2.length();
	    	
	    	String w4="";
	    	String w5="";
	    	String w6="";
	    	w4=sPlit2[1];
	    	String[] sPlit7=w4.split(",");
	    	String weather_title81=sPlit7[0].replace("白天", "");//第八天的白天的字段
	    	String weather_title82=sPlit7[1].replace("夜间", "");//第八天的夜晚的字段
            System.out.println(weather_title81);//第八天的白天天气情况
            System.out.println(weather_title82);//第八天的夜晚天气情况
	    	
	    	w5=sPlit2[2];
	    	String[] sPlit8=w5.split("~");
	    	String weather_temp81=sPlit8[0].replace("气温", "");
	    	String weather_temp82=sPlit8[1].replace("~", "").replace(",", "");
	    	System.out.println(weather_temp81);//第八天的最低气温
	    	System.out.println(weather_temp82);//第八天的最高气温
	    	
	    	w6=sPlit2[3];
	    	String[] sPlit9=w6.split(" ");
	    	String weather_winddirection81=sPlit9[0];
	    	String weather_windpower81=sPlit9[1];
	    	System.out.println(weather_winddirection81);//第八天的风向
	    	System.out.println(weather_windpower81);//第八天的风力
	    	
	    	
	    	String[] sPlit3=t3.split(" "); 
	    	int i3=t3.length();
	    	System.out.println(sPlit3[1]);
	    	System.out.println(sPlit3[2]);
	    	System.out.println(sPlit3[3]);
	    	
	    	String w7="";
	    	String w8="";
	    	String w9="";
	    	w7=sPlit3[1];
	    	String[] sPlit10=w7.split(",");
	    	String weather_title91=sPlit10[0].replace("白天", "");//第九天的白天的字段
	    	String weather_title92=sPlit10[1].replace("夜间", "");//第九天的夜晚的字段
            System.out.println(weather_title91);//第九天的白天天气情况
            System.out.println(weather_title92);//第九天的夜晚天气情况
	    	
	    	w8=sPlit3[2];
	    	String[] sPlit11=w8.split("~");
	    	String weather_temp91=sPlit11[0].replace("气温", "");
	    	String weather_temp92=sPlit11[1].replace("~", "").replace(",", "");
	    	System.out.println(weather_temp91);//第九天的最低气温
	    	System.out.println(weather_temp92);//第九天的最高气温
	    	
	    	w9=sPlit3[3];
	    	String[] sPlit12=w9.split(" ");
	    	String weather_winddirection91=sPlit12[0];
	    	String weather_windpower91=sPlit12[1].replace("<script", "");
	    	System.out.println(weather_winddirection91);//第九天的风向
	    	System.out.println(weather_windpower91);//第九天的风力
	    			
		} catch (MalformedURLException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			try {
				if (null != br) {
					br.close();
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
			br = null;

			try {
				if (null != isr) {
					isr.close();
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
			isr = null;

			try {
				if (null != in) {
					in.close();
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
			in = null;
		}

	}
}

输出:

7天后安庆天气:&nbsp;白天阵雨,夜间阵雨,&nbsp;气温2℃~9℃,&nbsp;北偏东风 二级
8天后安庆天气:&nbsp;白天阵雨,夜间阵雨,&nbsp;气温-1℃~7℃,&nbsp;北偏东风 二级
9天后安庆天气:&nbsp;白天局部多云,夜间局部多云,&nbsp;气温-1℃~8℃,&nbsp;北偏东风 二级<script
白天阵雨,夜间阵雨,
气温2℃~9℃,
北偏东风 二级
阵雨
阵雨
2℃
9℃
北偏东风
二级
阵雨
阵雨
-1℃
7℃
北偏东风
二级
白天局部多云,夜间局部多云,
气温-1℃~8℃,
北偏东风 二级<script
局部多云
局部多云
-1℃
8℃
北偏东风
二级





















目录
相关文章
|
12天前
|
存储 安全 Java
系统安全架构的深度解析与实践:Java代码实现
【11月更文挑战第1天】系统安全架构是保护信息系统免受各种威胁和攻击的关键。作为系统架构师,设计一套完善的系统安全架构不仅需要对各种安全威胁有深入理解,还需要熟练掌握各种安全技术和工具。
41 10
|
12天前
|
前端开发 JavaScript 开发者
揭秘前端高手的秘密武器:深度解析递归组件与动态组件的奥妙,让你代码效率翻倍!
【10月更文挑战第23天】在Web开发中,组件化已成为主流。本文深入探讨了递归组件与动态组件的概念、应用及实现方式。递归组件通过在组件内部调用自身,适用于处理层级结构数据,如菜单和树形控件。动态组件则根据数据变化动态切换组件显示,适用于不同业务逻辑下的组件展示。通过示例,展示了这两种组件的实现方法及其在实际开发中的应用价值。
20 1
|
24天前
|
机器学习/深度学习 人工智能 算法
揭开深度学习与传统机器学习的神秘面纱:从理论差异到实战代码详解两者间的选择与应用策略全面解析
【10月更文挑战第10天】本文探讨了深度学习与传统机器学习的区别,通过图像识别和语音处理等领域的应用案例,展示了深度学习在自动特征学习和处理大规模数据方面的优势。文中还提供了一个Python代码示例,使用TensorFlow构建多层感知器(MLP)并与Scikit-learn中的逻辑回归模型进行对比,进一步说明了两者的不同特点。
57 2
|
1月前
|
存储 搜索推荐 数据库
运用LangChain赋能企业规章制度制定:深入解析Retrieval-Augmented Generation(RAG)技术如何革新内部管理文件起草流程,实现高效合规与个性化定制的完美结合——实战指南与代码示例全面呈现
【10月更文挑战第3天】构建公司规章制度时,需融合业务实际与管理理论,制定合规且促发展的规则体系。尤其在数字化转型背景下,利用LangChain框架中的RAG技术,可提升规章制定效率与质量。通过Chroma向量数据库存储规章制度文本,并使用OpenAI Embeddings处理文本向量化,将现有文档转换后插入数据库。基于此,构建RAG生成器,根据输入问题检索信息并生成规章制度草案,加快更新速度并确保内容准确,灵活应对法律与业务变化,提高管理效率。此方法结合了先进的人工智能技术,展现了未来规章制度制定的新方向。
30 3
|
1月前
|
JavaScript 前端开发
电话号码正则表达式 代码 javascript+html,JS正则表达式判断11位手机号码
电话号码正则表达式 代码 javascript+html,JS正则表达式判断11位手机号码
78 1
|
27天前
|
SQL 监控 关系型数据库
SQL错误代码1303解析与处理方法
在SQL编程和数据库管理中,遇到错误代码是常有的事,其中错误代码1303在不同数据库系统中可能代表不同的含义
|
1月前
|
SQL 安全 关系型数据库
SQL错误代码1303解析与解决方案:深入理解并应对权限问题
在数据库管理和开发过程中,遇到错误代码是常见的事情,每个错误代码都代表着一种特定的问题
|
2月前
|
敏捷开发 安全 测试技术
软件测试的艺术:从代码到用户体验的全方位解析
本文将深入探讨软件测试的重要性和实施策略,通过分析不同类型的测试方法和工具,展示如何有效地提升软件质量和用户满意度。我们将从单元测试、集成测试到性能测试等多个角度出发,详细解释每种测试方法的实施步骤和最佳实践。此外,文章还将讨论如何通过持续集成和自动化测试来优化测试流程,以及如何建立有效的测试团队来应对快速变化的市场需求。通过实际案例的分析,本文旨在为读者提供一套系统而实用的软件测试策略,帮助读者在软件开发过程中做出更明智的决策。
|
2月前
|
SQL 人工智能 机器人
遇到的代码部份解析
/ 模拟后端返回的数据
16 0
|
2月前
|
设计模式 存储 算法
PHP中的设计模式:策略模式的深入解析与应用在软件开发的浩瀚海洋中,PHP以其独特的魅力和强大的功能吸引了无数开发者。作为一门历史悠久且广泛应用的编程语言,PHP不仅拥有丰富的内置函数和扩展库,还支持面向对象编程(OOP),为开发者提供了灵活而强大的工具集。在PHP的众多特性中,设计模式的应用尤为引人注目,它们如同精雕细琢的宝石,镶嵌在代码的肌理之中,让程序更加优雅、高效且易于维护。今天,我们就来深入探讨PHP中使用频率颇高的一种设计模式——策略模式。
本文旨在深入探讨PHP中的策略模式,从定义到实现,再到应用场景,全面剖析其在PHP编程中的应用价值。策略模式作为一种行为型设计模式,允许在运行时根据不同情况选择不同的算法或行为,极大地提高了代码的灵活性和可维护性。通过实例分析,本文将展示如何在PHP项目中有效利用策略模式来解决实际问题,并提升代码质量。

推荐镜像

更多