John Ousterhout 是斯坦福大学计算机系教授,也是 Tcl 语言的创造者。
今年四月,他出版了一本新书《软件设计的哲学》(A Philosophy of Software Design)。这是课程讲稿,160多页,亚马逊全部是五星好评。
我还没读这本书,但是我看了作者在谷歌的一次演讲(Youtube),介绍了这本书的主要内容。我觉得非常值得看,大部分书教你怎么写正确的代码,这本书教你如何正确设计软件。
下面我就根据演讲视频和网上的书评,做一下笔记。
一、什么是复杂性
Ousterhout 教授认为,软件设计的最大目标,就是降低复杂性(complexity)。 所谓复杂性,就是任何使得软件难于理解和修改的因素。
Complexity is anything that makes software hard to understand or to modify.
复杂性的来源主要有两个:代码的含义模糊和互相依赖。
Complexity is caused by obscurity and dependencies.
模糊指的是,代码里面的重要信息,看不出来。
依赖指的是,某个模块的代码,不结合其他模块,就会无法理解。
Obscurity is when important information is not obvious.Dependency is when code can't be understood in isolation.
复杂性的危害在于,它会递增。你做错了一个决定,导致后面的代码都基于前面的错误实现,整个软件变得越来越复杂。"我们先把产品做出来,后面再改进",这根本做不到。
Complexity is incremental, the result of thousands of choices. Which makes it hard to prevent and even harder to fix.
二、复杂性的隔离
降低复杂性的基本方法,就是把复杂性隔离。"如果能把复杂性隔离在一个模块,不与其他模块互动,就达到了消除复杂性的目的。"
Isolating complexity in places that are rarely interacted with is roughly equivalent to eliminating complexity.
改变软件设计的时候,修改的代码越少,软件的复杂性越低。
Reduce the amount of code that is affected by each design decision, so design changes don't require very many code modifications.
复杂性尽量封装在模块里面,不要暴露出来。如果多个模块耦合,那就把这些模块合并成一个。
When a design decision is used across multiple modules, coupling them together.
三、接口和实现
模块分成接口和实现。接口要简单,实现可以复杂。
Modules are interface and implementation. The best modules are where interface is much simpler than implementation.It's more important for a module to have a simple interface than a simple implementation.
好的 class 应该是"小接口,大功能",糟糕的 class 是"大接口,小功能"。好的设计是,大量的功能隐藏在简单接口之下,对用户不可见,用户感觉不到这是一个复杂的 class。
最好的例子就是 Unix 的文件读写接口,只暴露了5个方法,就囊括了所有的读写行为。
四、减少抛错
有些软件设计者喜欢抛错,一遇到问题,就抛出一个 Exception。这也导致了复杂性,用户必须面对所有的 Exception。"反正我告诉你出错了,怎么解决是你的事。"
正确的做法是,除了那些必须告诉用户的错误,其他错误尽量在软件内部处理掉,不要抛出。
Tcl 语言的最初设计是,unset() 方法用来删除已经存在的变量,如果变量不存在,该方法抛错。Ousterhout 教授说,这个设计是一个错误,完全不应该抛错,只要把 unset() 定义成让一个变量不存在,就解决问题了。
另一个例子是,Windows 系统不能删除已经打开的文件,会有错误提醒。这也是一个设计错误,有些用户实在删不掉这些文件,不得不重启系统。Unix 的做法是,总是允许用户删除文件,但是不清理内存,已经打开的文件在内存里面继续存在,因此不会干扰其他程序的运行,那些程序退出保存文件的时候,发现文件不存在才会报错。这个设计比较好。