本节书摘来自异步社区《编程珠玑(续)(修订版)》一书中的第1章,第1.7节深入阅读,作者【美】Jon Bentley,更多章节内容可以访问云栖社区“异步社区”公众号查看。
1.7 深入阅读
Don Knuth的“Empirical Study of Fortran Programs”发表在1971年Software——Practice and Experience 第一卷上(第105~133页)。关于“动态统计”的第3节讨论了行计数和过程时间计数,以及用这两种计数搜集的统计数据。第4节调优了17个关键的内循环,获得了从1.5~13.1倍的加速。在过去的十几年中,我每年至少要读一遍这篇经典论文,越读越觉得好,因此我强烈推荐这篇论文。
①Brian Kernighan(1942—),著名计算机科学家,现为普林斯顿大学教授。他与人合作创造了Awk和AMPL编程语言,对Unix和C语言的设计也有很大贡献。他还与人合写了多部计算机名著,包括与Ritchie合著的_The C Programming Language_。——编者注
②Don Knuth(1938—),中文名高德纳,著名计算机科学家,斯坦福大学荣休教授。因对算法分析和编程语言设计领域的贡献获1974年图灵奖。他是名著《计算机程序设计艺术》的作者,设计了TEX排版系统。——编者注
③这7个过滤程序执行下列任务:(1) 连接所有输入文件;(2) 让每行包含一个单词,办法是把字母表以外的符号(-c
)翻译成新行(ASCII八进制12),去掉重复的空行(-s
);(3) 把大写翻译成小写;(4) 排序,以便把相同的单词归并在一起;(5) 把连续的相同单词换成一个代表单词及其计数(-c
);(6) 按照数值(-n
)递减(-r
)顺序来排序;(7) 经过一个流编辑器,在打印25行后退出(q
)。本书10.5节用图片描述了上述第(4)、(5)、(6)步中的sort
¦ uniq –c
¦ sort
组合。
④第二次排序花了第一次排序25%的时间,却只处理了输入行数的8%——数值(-n
)标记很费时间。当我们在单列输入上监视这个管道的性能时,第二次排序几乎与第一次排序花一样的时间。这个性能监视的结果对输入数据很敏感。
⑤Peter Weinberger,著名计算机科学家,现在谷歌任职。他是Awk语言的设计者之一(Awk中的w),曾任贝尔实验室计算机科学研究部主任。——编者注
⑥Rob Pike(1956—),著名计算机科学家,现任职于谷歌。他参与了Unix操作系统的开发,并领导了分布式操作系统Plan 9和Inferno以及Limbo语言的设计。他与Kernighan合撰了名著《程序设计实战》。——编者注
本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。