热门
如果有一个大数据量的文本文件,每行一个字符串,如何用java对该文件进行排序并且去重?
键还是看数据量大小,如果可以在内存里,直接用 java.util.TreeSet 就解决了。如果数据量特别大,不适合直接在内存里处理,又不想自己写太复杂的算法,就用临时文件,分段缓存,先保证唯一性,再对每一段进行排序,最后组合起来。更简单的一点的办法就是用数据库,比如 SQLite,全部插入,排序,去重,处理起来都比较简单了。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。