处理hadoop发送的文件到后台并解析存储到数据库策略-阿里云开发者社区

处理hadoop发送的文件到后台并解析存储到数据库策略

2015-05-01 838

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云解析 DNS，旗舰版 1个月

全局流量管理 GTM，标准版 1个月

公共DNS（含HTTPDNS解析），每月1000万次HTTP解析

简介： 处理hadoop发送的文件到后台并解析存储到数据库策略主要实现：首先 hadoop mapreduce 处理好的文件，一个个放到指定的文件目录下，然后通过在Linux 下通过定时任务打包发到 web 服务器的指定目录下，然后web 服务器会通过定时任务去解析它，然后，存储导数据库。

处理hadoop发送的文件到后台并解析存储到数据库策略

主要实现：首先 hadoop mapreduce 处理好的文件，一个个放到指定的文件目录下，然后通过在Linux 下通过定时任务打包发到 web 服务器的指定目录下，然后web 服务器会通过定时任务去解析它，然后，存储导数据库。

1.上篇介绍了文件的解压，通过解压后文件会形成多个文件。

如图，解压后，我们会发现有很多文件，然后我们该去对每个文件读取内容并存到数据库中。

2. map 为所有文件解析类

dataMap 所有数据类所有文件的数据都存储到datamap 中了

for (File subfile : subFiles){
	AbstractFileParser ifp = map.get(subfile.getName());
	if (ifp != null) {
		try {
			ifp = ifp.getClass().newInstance();
			ifp.init(subfile, (StatMap) dataMap.get(subfile.getName()));
			jobList.add(ifp);
			ifp.start();
		} catch (Exception e) { e.printStackTrace(); }
	}
}
for (Thread ifp : jobList)
{
	try {
		ifp.join();
	} catch (InterruptedException e) { e.printStackTrace(); }
}

AbstractFileParser 类

BufferedReader bufferedReader = null;
try
{
	bufferedReader = new BufferedReader(new FileReader(this.file));
	String s = null;
	while ((s = bufferedReader.readLine()) != null)
	{
		if (isDebug || logger.isDebugEnabled())
			logger.debug(s);
		String[] ss = s.split(",");
		StatBase o = parseLine(ss);
		if (o != null)
		{
			StatBase b = null;
			synchronized (map)
			{
				b = map.get(o.getPrivateKey());
				if (b == null)
				{
					map.put(o.getPrivateKey(), o);
				}
				else
				{
					update(o, b);
				}
			}
		}
	}
}
catch (Exception e)
{
	logger.error("", e);
}
finally
{
	if (bufferedReader != null)
		try
		{
			bufferedReader.close();
		}
		catch (IOException e)
		{
		}
}

保存到 datamap 中的数据要进行数据库保存

捐助开发者

在兴趣的驱动下,写一个免费的东西，有欣喜，也还有汗水，希望你喜欢我的作品，同时也能支持一下。当然，有钱捧个钱场（右上角的爱心标志，支持支付宝和PayPal捐助），没钱捧个人场，谢谢各位。

谢谢您的赞助，我会做的更好！

处理hadoop发送的文件到后台并解析存储到数据库策略

捐助开发者

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像