因为做一个5g数据的xml解析,5g太大了,不能解析,最后的方案是分割+线程来控制,因为在分割的时候,我是按照节点分割的,所有原来有5g的xml,最后通过自定义的程序分割后,只有1g了。
希望大神帮助下,,
如果可以也可以提供分割工具一下,,网上的找的都没成功过。0,0
很好奇是什么数据啊,5G大啊,,,这么大的数据不适合做文本分析了吧,,,,,######
我还是自己用流读取的方式,分割了文件。。。分成了50M一个的大小的xml...然后用了gc,对于程序工作到一定时候,进行了回收处理。外层则用线程控制。
有一点补充,前面那个解压的问题,是内存占用的问题。内存不够,就可能产生这种现象。
现已经解决。谢谢各位
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。