求教Java问题-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

求教Java问题

如果有一个大数据量的文本文件,每行一个字符串,如何用java对该文件进行排序并且去重?

展开
收起
蛮大人123 2016-02-25 11:36:08 2098 0
2 条回答
写回答
取消 提交回答
  • 阿里巴巴高级研发工程师
    请问是什么问题?
    2019-07-17 18:47:20
    赞同 展开评论 打赏
  • 我说我不帅他们就打我,还说我虚伪

    键还是看数据量大小,
    如果可以在内存里,直接用 java.util.TreeSet 就解决了。
    如果数据量特别大,不适合直接在内存里处理,又不想自己写太复杂的算法,就用临时文件,分段缓存,先保证唯一性,再对每一段进行排序,最后组合起来。更简单的一点的办法就是用数据库,比如 SQLite,全部插入,排序,去重,处理起来都比较简单了。

    2019-07-17 18:47:20
    赞同 展开评论 打赏
问答排行榜
最热
最新
相关电子书
更多
OpenCrypto Unchaining the Java
立即下载
Java Your(Next)
立即下载
EXTENDING SPARK WITH JAVA AGEN
立即下载