编程语言之问:何时该借用,何时该创造?

简介: 编程语言之问:何时该借用,何时该创造?


6 月 22 日,Python 之父 Guido 发了一条推特,说了 Python 的一则历史故事,他说 elif 是从 C 语言中偷过来的:

elif 是“else if”的简写,用于条件判断。当只有两个分支时,我们会写成“if...else...”,当出现更多分支时,我们会写成如下格式:

if 判断条件1:
    做事情1
elif 判断条件2:
    做事情2
else:
    做其它事

简写而成的 elif 不仅是减少了几个字符,而且由于单一而清晰的用途,它还不会给我们带来理解或使用上的困惑。

但是,简写法并不是主流,完整写法才是主流,C 语言中就是采用完整的写法:

if(判断条件1)
{
   做事情1
}
else if(判断条件2)
{
   做事情2
}
else 
{
   做其它事
}

没错,C 语言使用的是全拼写法,但是在它的预处理/预编译语句中,还有一个 elif 指令,Guido 所说的“偷”,就是从这来的:

#if 常量表达式1
// 编译1
#elif 常量表达式2
// 编译2
#else
// 编译3
#endif

Python 没有预编译,所以所谓的偷,跟预编译没有关系,只是在对比两种写法后,借用了更简洁的写法而已。

为什么 C 语言不把两种写法统一起来呢?这我不得而知了,而 Guido 在两种写法中,选择了后一种非主流却更好用的写法。我想对他说,你“偷”得好啊!

实际上,留言区里的人也有同感,纷纷表示:不介意、很 okay、非常喜欢,还有人说“不是偷,而是收获(harvested)”、“不是偷,而是把它提升了一些高度”……

前不久,我写了一篇《聊聊 print 的前世今生》,print 这个词就是从 C 语言中借用来的。除此之外,如果有人仔细比较这两种语言的关键字和习惯命名,肯定会发现不少相同的内容。

编程语言间有一些共享的元素,这很常见,创造一门语言并不意味着要原创每一个词句,毕竟大部分思想是共通的,作为基础设施的词语更是如此。

那么,我突然好奇了:创造一门编程语言时,什么时候该借用,什么时候该创造呢?

这个问题看起来可能没啥意义,因为终其一生,我们多数人也不大可能会参与创造一门编程语言。

但我觉得它还是极有意义的,首先,提问精神值得肯定,其次,它还提供了一种溯源、甄别、遴选、创造的体系性视角,我认为这是求知的正确思维方式。

带着这个疑惑,我特别想要考察的是 Python 的 for 循环。

如果你有其它语言基础,就知道 “for 循环”通常指的是这样的三段式结构:

for ( init; condition; increment ){
   statement(s);
}
// java
for(int x = 10; x < 20; x = x+1) {
    System.out.print("value of x : " + x );
    System.out.print("\n");
}

这种 C 风格的写法是很初级的东西,不少语言都借用了。但是,它的写法实在繁琐,为了更方便地遍历集合中的元素,人们在 for 循环之外又引入了升级版的 foreach 循环:

// java
int[] a = {1,2,3};
for(int i : a){
    System.out.print(i + ",");
}
// C#
int[] a = {1,2,3};
foreach(int i in a){
    System.Console.WriteLine(i);
}

Python 中也有 for 循环,但是,它借用有度,在设计上早早就有自己独到的考虑,它直接摒弃了三段式的 for 循环,而是采用类似 foreach 的一种写法:

for iterating_var in sequence:
   statements(s)
# 例子
for i in range(3):
    print(i)
for i in "hello":
    print(i)

从表面上看,Python 的 for 循环跟其它语言的 foreach 很相似,但实际上,它的工作原理却很不相同。

为什么会有不同呢?主要是因为 Python 的 for 语句用于可迭代对象上,而不仅仅是用于集合或者普通的容器(虽然它们也是可迭代对象),而可迭代对象还可再细分出迭代器与生成器,这会造成最终结果的极大差异。

先看看两个例子:

# 例1,普通可迭代对象
x = [1, 2, 3]
for i in x:
    print(i)
for i in x:
    print(i)
# 例2,迭代器或生成器
y = iter([1, 2, 3])
# y = (i for i in [1,2,3])
for i in y:
    print(i)
for i in y:
    print(i)

例 1 中,“1 2 3”会被打印两次,而在例 2 中,则只会打印一次。

普通可迭代对象只有 __iter__() 魔术方法,而不像迭代器一样拥有 __next__() 魔术方法,这意味着它无法实现 自遍历 过程,同时在经过 for 循环的 它遍历 后,也不会破坏原有的结构。(这两个是我创造的概念,详见《Python进阶:迭代器与迭代器切片》)。

但是,迭代器是一种匮乏的设计,具有单向损耗的特性,遍历一次后就会被破坏掉,不能重复利用。(关于迭代器的设计问题,这篇文章值得一看《当谈论迭代器时,我谈些什么?》)。

这表明了,Python 中 for 循环的使用场景很广阔,而且它还可能带来非纯结果,即重复执行同样的代码块,会出现不同的结果。

这是不是跟别的语言很不同了呢?相同的关键字,相似的循环思想与写法,但是,带来的影响却有差别。

关于 Python 的 for 循环,还有一个很独特的设计,即 for-else 结构:

x = [1, 2, 3]
for i in x:
    print(i, end = " ")
else:
    print("ok")
# 输出:1 2 3 ok

本文开头提到了 if-else 结构,只有在不满足 if 条件时,才会执行到 else 部分,也就是说,如果 if 语句为真,那执行完它的语句块后,就会跳过 else 部分。

这是一种非此即彼的并行关系 ,直白地说是“如果...就...;否则就...” 。

但是,对于 for-else 结构,for 语句并不是在做真值判断,它的程序体必然会执行(除非可迭代对象为空),执行后还会继续执行 else 部分。

所以,它是一种先此后彼的串行关系 ,翻译出来则是“对于...就...;然后...”。

这种结构肯定不是从 C 语言中借用来的,至于是否为 Python 所独创,我不确定(大概率是,姑且认为是吧),如果有知情的同学,烦请告知。

那么,为什么 Python 要加上这种设计呢,它有什么实际的用途么?

x = [1,2,3]
for i in x:
    if i % 2 == 0:
        print(i)   # match
        break
else:
    print("mismatch")

上例的 for 部分增加了一个判断以及 break,这个 break 不仅会跳出 for 循环本身,还会跳过 else 部分。

上例的作用是查找偶数,如果找到则打印出来,如果 for 循环遍历完都找不到,则进入到 else 分支,打印“mismatch”的结果。

所以,其实 else 是 for 循环有没有正常遍历结束的标记,如果在循环后没有达到某种目标而跳出(break、return 或者 raise),就可以在 else 中做必要的补充(记录日志、抛出异常等等)。

这种设计并不算一个好的设计,因为 else 会带来误解(if-else 那种非此即彼的关系),而且它的最大用途需要结合 break 等跳出循环的操作,但是这层信息却非显而易见的。

在核心开发者的邮件列表里,就有不少争论点,2009 年的这封邮件梳理了大家的讨论(mail.python.org/pipermail/p…)。

其中,有开发者提议:

  • 移除这个写法
  • 如果用了却没写 break,就生成告警提示
  • 替换 else 关键字(如 then、finally、else no break)
  • 增加其它的功能

这封邮件一一列举了这些观点的提出原因及改进想法,然后又一一地反驳了它们,最后的结论是保持 for-else 写法不变,也就是大家现在看到的实现方式。它的完整语义是:

execute the for-loop (or while-loop)
if you reach a `break`, jump to the end of the `for...else` block
else execute the `else` suite

也就是说,else 对标的是“是否执行 break”,如果没有 break,则进入else。

但是,我并不认可这种做法,因为 break 是隐含条件,在直观上我们只看到了 for-else,很容易产生 if-else 那样的联想。因此,我反而赞同把 else 改为 then,以消除误会。

这封邮件的反驳意见是,改成 then 会引入新的关键字,因此不好。

我认为这个说法有些牵强(从使用者的角度),还记得本文开头的内容么,elif 就是新引入的关键字啊,看看它现在是多受欢迎。

elif 属于那种初看不知何意,但知道后肯定会记住的词,而且也不大可能拼写错误。为了这点简洁易拼写的好处,它就被引入成新的关键字了。

for-else 中的 else 属于那种初看以为知道含义的词,但实际却表达着不同意思(准确地说是,由于不知道隐含条件,而造成的误解),为了清晰语义的好处,我认为可以引入新的关键词 then 来替代 else。

不过,我转念一想,现在讨论这个已经没有意义了,毕竟时间已经过去了,那都是 10 年前的讨论了。

如果在 Python 创造之初,或者在 Python 3 大版本改动之初,这个讨论就被提出,那很可能 for-else 会被设计成 for-then ,then 会像引入 elif 关键词一样被引入。

如果是那样,说不定 Guido 某天心血来潮说起这则历史小故事,留言区又会出现一大片的赞同之声呢。

聊到这里,意犹未尽,但主题似乎有点跑偏,我们来稍微总结几个要点吧:

  • Python 从 C 中借用了 elif,受到赞许
  • Python 没有借用 C 传统的三段式 for 循环
  • Python 采用类似 foreach 的表达,但应用范围更广
  • Python 的 for 循环由于迭代器的设计原因,会造成一些陷阱
  • Python 创造了 for-else 结构,它的隐含语义是 for-(if break)-else,曾有讨论是否要创造新的关键词替换 for-else,但是被否决了

本文谈到的内容很微小,好像没有什么实际的帮助,不知道 elif 来源、不知道 for 循环的细节、不知道 for-else 的用途与争论,这些统统都不会造成语言使用上的障碍。

但我还是那个观点:

阅读 Python 的历史,从中你可以看到设计者们对功能细节的打磨过程,最终你就明白了,Python 是如何一步一步地发展成今天的样子。


目录
相关文章
|
7月前
|
存储 Python
揭秘python函数:编程艺术的核心力量(2)
揭秘python函数:编程艺术的核心力量(2)
|
7月前
|
小程序 开发者 Python
揭秘python函数:编程艺术的核心力量
揭秘python函数:编程艺术的核心力量
|
4月前
|
Rust 安全 Go
揭秘Rust语言:为何它能让你在编程江湖中,既安全驰骋又高效超车,颠覆你的编程世界观!
【8月更文挑战第31天】Rust 是一门新兴的系统级编程语言,以其卓越的安全性、高性能和强大的并发能力著称。它通过独特的所有权和借用检查机制解决了内存安全问题,使开发者既能享受 C/C++ 的性能,又能避免常见的内存错误。Rust 支持零成本抽象,确保高级抽象不牺牲性能,同时提供模块化和并发编程支持,适用于系统应用、嵌入式设备及网络服务等多种场景。从简单的 “Hello World” 程序到复杂的系统开发,Rust 正逐渐成为现代软件开发的热门选择。
74 1
|
3月前
|
JavaScript 前端开发 Python
探索编程的本质:从代码到哲学的奇妙旅程
该文档指导如何安装NodeJS及PyExecJS。首先从官网下载并安装NodeJS,验证安装是否成功可通过命令`node --version`检查版本。PyExecJS则通过`pip install PyExecJS`进行安装。安装后,通过Python导入`execjs`模块可查看执行JS的环境,并使用`eval`和`compile`函数执行JavaScript代码或编译JS脚本。具体案例展示了简单的JS执行与环境选择方法。
18 1
|
3月前
|
Java 测试技术 Android开发
移动应用开发之旅:从概念到现实
【9月更文挑战第7天】在数字化的浪潮中,移动应用已成为我们生活的一部分。本文将引导你了解移动应用开发的核心概念、操作系统的选择以及如何将一个创意转化为现实中可用的应用。我们将一起探索这个过程,并揭示背后的技术细节。无论你是初学者还是有经验的开发者,这篇文章都将为你提供宝贵的见解和实用的知识。
34 2
|
4月前
|
Rust 开发者
揭秘Rust编程:模块与包的终极对决,谁将主宰代码组织的新秩序?
【8月更文挑战第31天】在软件工程中,模块化设计能显著提升代码的可读性、可维护性和可重用性。Rust 作为现代系统编程语言,其模块和包管理机制为开发者提供了强有力的工具来组织代码。本文通过对比模块和包的概念及使用场景,探讨了 Rust 中的最佳实践。
42 2
|
4月前
|
JavaScript 前端开发 安全
TypeScript:编程界的革命宣言,如何用它重塑你的代码王国?
【8月更文挑战第22天】TypeScript是由微软开发的JavaScript超集,自2012年发布以来,通过引入类型安全与面向对象编程特性,极大地提升了开发效率与代码可靠性。它允许开发者在编译阶段捕获错误,支持接口与类定义,具备高级类型如联合与交叉类型,并且拥有枚举、装饰器等功能。此外,TypeScript的模块系统便于大型项目的组织与管理,结合异步编程支持,使得复杂应用开发更加简洁明了。
29 1
|
4月前
|
JavaScript 前端开发 编译器
TypeScript:一场震撼前端开发的效率风暴!颠覆想象,带你领略前所未有的编码传奇!
【8月更文挑战第22天】TypeScript 凭借其强大的静态类型系统和丰富的工具支持,已成为前端开发的优选语言。它通过类型检查帮助开发者早期发现错误,显著提升了代码质量和维护性。例如,定义函数时明确参数类型,能在编译阶段捕获类型不匹配的问题。TypeScript 还提供自动补全功能,加快编码速度。与 Angular、React 和 Vue 等框架的无缝集成进一步提高了开发效率,使 TypeScript 成为现代前端开发中不可或缺的一部分。
46 1
|
4月前
|
开发者 Ruby
神秘编程魔法惊现!Ruby 元编程究竟隐藏着怎样的力量?竟能让代码自我进化!
【8月更文挑战第31天】《Ruby元编程:让代码自我进化》介绍了Ruby元编程的魅力,通过动态修改代码结构和行为,实现代码自我进化。文章通过实例展示了如何使用`class_eval`动态添加属性和方法,以及通过别名修改现有方法。此外,还介绍了利用模块实现代码复用和扩展。元编程为开发者提供了极大的灵活性和创造力,使代码更加动态高效。
32 0
|
4月前
|
开发者 Python
Python 模块化方式编程:在编程热潮中找到归属感,让代码更具魅力与活力
【8月更文挑战第22天】Python 以其简洁强大备受青睐。模块化编程将大型程序拆分成独立模块,每个负责特定功能,简化代码结构,提升可读性和维护性。通过创建如“math_utils.py”这样的文件来定义数学运算函数,可在其他文件中轻松导入使用。这种方式提高了代码的可重用性,便于管理和更新。在项目开发中按功能划分模块,如用户、商品和订单管理等,有助于保持清晰的代码结构和减少依赖复杂度。遵循良好的命名规范,可以使模块更易理解与使用。
50 0