开发者社区 问答 正文

求教Java问题

如果有一个大数据量的文本文件,每行一个字符串,如何用java对该文件进行排序并且去重?

展开
收起
蛮大人123 2016-02-25 11:36:08 2293 分享 版权
2 条回答
写回答
取消 提交回答
  • 阿里巴巴高级研发工程师
    请问是什么问题?
    2019-07-17 18:47:20
    赞同 展开评论
  • 我说我不帅他们就打我,还说我虚伪

    键还是看数据量大小,
    如果可以在内存里,直接用 java.util.TreeSet 就解决了。
    如果数据量特别大,不适合直接在内存里处理,又不想自己写太复杂的算法,就用临时文件,分段缓存,先保证唯一性,再对每一段进行排序,最后组合起来。更简单的一点的办法就是用数据库,比如 SQLite,全部插入,排序,去重,处理起来都比较简单了。

    2019-07-17 18:47:20
    赞同 展开评论