15 分钟了解 Monad(下)

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 15 分钟了解 Monad

为了解决这个问题, 我们像之前一样, 引入两个辅助函数:

def unit(x):
    return (x, [x])
def bind(t, f):
    res = f(t[0])
    return (res, t[1] + [res])

现在, 我们又可以链式调用了:

print( bind(bind(bind(unit(x), f1), f2), f3) )

下面的图表展示了当 x=0 的时候, v1, v2, v3 分别代表了中间变量.640 (1).png

3 Nulls/Nones

下面让我们来引入类和对象. 假设我们有一个类 Employee:

class Employee:
    def get_boss(self):
        """Retrun the employee's boss"""
    def get_wage(self):
        """Compute the wage"""

每个 Employee 实例都有一个 boss, 也就是老板, 并且也是 Employee 类型的, 还有一个工资属性. 我们可以通过两个方法来访问他们. 每一个方法都有可能返回 None (也就是说工资不知道, 或者是 没有 boss). 在这个例子中, 我们要开发一个程序, 给定一个 Employee, 比如说 john, 返回他的老 板的工资, 如果不能确定工资的话, 或者 john 是 None, 那么我们应该返回 None.

理想情况下, 我们只要这样写就好了:

print(john.get_boss().get_wage())

然而, 因为每个方法都可能返回 None, 我们得这么写:

result = None
if john is not None and john.get_boss() is not None and john.get_boss().get_wage() is not None: result = johs.get_boss().get_wage()
print(result)

然而, 在这个方案中, 我们调用了好多次 getboss 和 getwage 方法. 如果这两个方法调用起来代 价很大的话(比如说需要查询数据库), 那么显然是不合适的. 所以方案应该是:

result = None
if john is not None:
    boss =  john.get_boss()
    if boss is not None:
        wage = boss.get_wage()
        if wage is not None:
            result = wage
print(result)

这个方案显然不太好看, 三层 if 语句看起来太臃肿了. 为了解决这个问题, 我们使用和刚刚一样的 方法: 定义下面的辅助函数

def unit(e):
    return e
def bind(e, f):
    return None if e is None, else f(e)

现在我们可以直接链式调用了:

print(bind(bind(unit(john), Employee.get_boss), Employee.get_wage))

你可能已经注意到了, 我们实际上并不需要调用 unit(john), 因为他就是返回自身而已. 我们这样 做的原因是为了和之前的模式保持一致, 这样我们就能推广泛化到更通用的模式. 另外需要注意的是 , 在 Python 中, 方法也只是普通的函数, john.getboss() 和 Employee.getboss(john) 是完全 一样的意思.

下面的图表显示了在 john 没有 boss 的情况下的计算过程.640 (2).png

泛化 - Monads

如果我们想要组合函数 f1, f2, ... fn. 如果所有的参数都和返回类型对的上, 那么我们可以直接 调用 fn(...f2(f1(x))...). 下面的图说明了隐含的计算过程. v1, v2...vn 标识了其中的中间变量 .640 (3).png然而, 这种情况往往是不存在的. 比如说在我们之前的日志例子中, 输入类型和输出类型是不能匹配 的, 在第二个和第三个例子中, 函数是可以组合的, 但是我们想要在其中"注入"我们额外的逻辑. 在 第二个例子中, 我们想要记录中间值, 而在第三个例子中, 我们想要加入 Null/None 检测.

命令式解法

在上面的例子中, 我们首先使用了直观的命令式解法. 如下图所示:640 (4).png在调用 f1 之前, 我们首先执行一些初始化代码. 比如, 在例子1 和例子2 中, 我们初始化了存储日 志和中间值的变量. 在之后我们调用 f1, f2...fn 等函数的时候, 我们添加了一些胶水代码. 在例 子1 和例子2 中, 胶水代码分别负责聚合日志和中间值. 在例子3 中, 胶水代码负责检查中间值是否 是空的, 也就是 Null/None.

引入 Monad

正如我们在上面的例子中看到的一样, 直接的方法会有一些让人不悦的副作用 -- 丑陋的胶水代码, 多次检查 Null/None 等等. 为了实现更优雅的方案, 在上面的例子中, 我们使用了一种设计模式, 包含了 unit 和 bind 两种函数. 这种设计模式就叫做 Monad. 本质上来说, bind 函数实现了 胶水代码, 而 unit 实现了初始化代码. 这就让我们可以在一行之内解决问题:

bind(bind(...bind(bind(unit(x), f1), f2)...fn-1), fn)

下面的图表说明了计算过程:640 (5).pngunit(x) 产生了初始值 v1, 然后 bind(v1, f1) 生成了新的中间值 v2, 然后在被用到了 bind(v2, f2) 中, 整个过程一直持续到最终结果产生. 使用这个模式, 配合上不同的 unit 和 bind 函数, 我们可以实 现多种不同的函数组合. 标准的 Monad 库提供了几种预定义好的常用 monad(也就是 unit 和 bind 函数), 可以直接拿来用.

为了组合 bind 和 unit 函数, unit 和 bind 的返回值, 和 bind 的第一个参数必须是匹配的. 这 叫做 Monadic 类型. 在上面的 Monad 计算过程中, 所有的中间值的类型都是 Monadic.

最后, 重复调用bind显然也是丑陋的, 我们可以定义一个函数来辅助操作.

dep ipeline(e, *fns):
    for fn in fns:
        e = bind(e, fn)
    return e

下面的代码:

bind(bind(bind(bind(unit(x), f1), f2), f3), f4)

就可以改成:

pipeline(unit(x), f1, f2, f3, f4)

结论

Monad 是函数组合的一种简单又强大的设计模式. 在声明式的语言中, 他被用来实现命令式语言中的 日志和 IO 操作. 在命令式的语言中, 他可以用来减少和隔离冗余的胶水代码. 本文只是简单地介绍 了 Monad 的一些只管解释, 还可以查看下面这些资料:

  1. Monad on Wikipedia
  2. Monads in Python
  3. List of Monad tutorials
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
4月前
|
存储 JavaScript 前端开发
JavaScript——函数式编程Functor(函子)
JavaScript——函数式编程Functor(函子)
27 0
|
Rust
15 分钟了解 Monad(上)
15 分钟了解 Monad
86 0
|
JavaScript 容器
【函数式编程】基于JS进行函数式编程(四)函子 | MayBe函子 | Monad函子
【函数式编程】基于JS进行函数式编程(四)函子 | MayBe函子 | Monad函子
177 0
【函数式编程】基于JS进行函数式编程(四)函子 | MayBe函子 | Monad函子
|
JavaScript 前端开发 容器
promise is a monad?
态射是范畴内对象之间的映射关系。函子与它类似,函子是范畴与范畴间的映射关系,也就是可以通过一个函子,把一个范畴映射到另一个范畴。
1724 0
|
前端开发 JavaScript 程序员
Promise是Monad吗?
译者按: 近年来,函数式语言的特性都被其它语言学过去了。 原文: Functional Computational Thinking — What is a monad? 译者: Fundebug 为了保证可读性,本文采用意译而非直译。
845 0