开发者社区> 问答> 正文

300万数据量的汉字拼音排序,能优化到什么程度呢?:报错

每个字符串通常是汉字字符串,也有可能夹杂少量英文数字字符,长度在0-128个之间

我目前的做法是先将所有汉字生成一个拼音排序队列,长度有2w多个

然后比较的时候直接解码,从队列中获取排列序号,再根据此排列序号按照通常字符串比较的方式来比较汉字字符串

排序使用qsort,比较函数是定制的比较函数

目前100w有4m,300w有8-9m

大家有没有更好的方法呢?

展开
收起
kun坤 2020-06-14 14:05:26 557 0
0 条回答
写回答
取消 提交回答
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载