文档备案控制台

开发者社区问答正文

请教各位PHP如何提高文件查询效率？

要从一个文件中查出以唯一字符串 a 开头的那一行，怎么能提高查询效率。
我现在的方法很笨：
1.按行把文件内容存入一个数组
2.用正则去match数组中的每一个元素直到找到为止
这样感觉效率很低，因为文件有17万行，所以最低也要循环17万次...
初学者希望得到大家的帮助，谢谢。

展开

收起

落地花开啦 2016-06-13 13:24:16 2298 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

落地花开啦

喜欢技术，喜欢努力的人
把这个文件处理成一个用字典树(trie)或者B树存储的结构，然后就可以快速查询了。
前面说得可能太抽象，给你一个容易实现的算法吧。效率虽然比trie/b-tree略低，但是也很够用。
预处理
1. 遍历这个文件，记录每行的offset记录下来，作为int的数组。
2. 对这个数组进行间接排序。注意，所谓间接，指的是排序时比较的是这个数组元素指向的行。
3. 将这个数组保存起来（17w个int，也就不到700KB，随便什么地方保存）。
  查询
4. 读取这个数组。
5. 使用"间接"二分查找。注意，查找时比较的是对应行的前n个字符，n == strlen(a)。
2019-07-17 19:35:41

赞同展开评论

问答分类：

PHP

问答标签：

PHP查询 PHP文件 PHP效率

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

在表格存储中php查询多元索引的时候怎么自定义排序呢？

131

2

0

阿里云导播平台PHP调用创建导播台后，为什么查询导播台接口查询不到刚刚创建的导播台？

155

1

0

阿里函数计算中，找到php.ini，修改conf.d里面的20-swoole.ini文件

1022

1

0

打开wp-config.php是应该在我的仓库内是吗 ? 不太懂，是不是直接在文件

374

1

0

php、sdk介入阿里云tablestore如何实现sum和count查询呢？

902

1

0

php显示没有权限写文件怎么办?

1227

2

0

ECS PHP 在RPC调用时,查询多个实例ID时，总是报错。

2064

2

0

用aliyun-oss-php-sdk-master 上传中文文件名报错

700

0

0

Flume中Ganglia php页面显示为文件或者提示下载文件解决方法是什么呢?

549

1

0

zabbix中用什么函数来表示优先处理index php命名的文件？

529

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

FrankenPHP 原生支持 Windows 了

PHP 8 新特性：让代码更优雅的四个技巧

蓝易云：用PHP实现持续监听Redis订阅并将消息推送至前端的技术

Mail2Shell漏洞利用机制与FreeScout补丁绕过深度剖析

监控局域网电脑屏幕的哈希表优化PHP语言算法

还有其他疑问?