Python 入门指南(七)(1)

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: Python 入门指南(七)


原文:zh.annas-archive.org/md5/97bc15629f1b51a0671040c56db61b92

译者:飞龙

协议:CC BY-NC-SA 4.0

第二十二章:Python 设计模式 I

在上一章中,我们简要介绍了设计模式,并介绍了迭代器模式,这是一个非常有用和常见的模式,以至于它已经被抽象成了编程语言本身的核心。在本章中,我们将回顾其他常见的模式,以及它们在 Python 中的实现方式。与迭代一样,Python 通常提供另一种语法来使处理这些问题更简单。我们将涵盖这些模式的传统设计和 Python 版本。

总之,我们将看到:

  • 许多特定的模式
  • Python 中每种模式的典型实现
  • 用 Python 语法替换某些模式

装饰器模式

装饰器模式允许我们用其他对象包装提供核心功能的对象。使用装饰过的对象的任何对象将以与未装饰的对象完全相同的方式与其交互(即,装饰过的对象的接口与核心对象的接口相同)。

装饰器模式的两个主要用途:

  • 增强组件发送数据到第二个组件的响应
  • 支持多个可选行为

第二个选项通常是多重继承的一个合适的替代方案。我们可以构建一个核心对象,然后创建一个装饰器包装该核心。由于装饰器对象具有与核心对象相同的接口,我们甚至可以将新对象包装在其他装饰器中。以下是它在 UML 图中的样子:


在这里,Core和所有的装饰器都实现了特定的接口。装饰器通过组合维护对接口的另一个实例的引用。当调用时,装饰器在调用其包装的接口之前或之后进行一些附加处理。被包装的对象可以是另一个装饰器,也可以是核心功能。虽然多个装饰器可以相互包装,但是所有这些装饰器中心的对象提供了核心功能。

一个装饰器的例子

让我们看一个来自网络编程的例子。我们将使用 TCP 套接字。socket.send()方法接受一串输入字节并将它们输出到另一端的接收套接字。有很多库可以接受套接字并访问这个函数来在流上发送数据。让我们创建这样一个对象;它将是一个交互式 shell,等待客户端的连接,然后提示用户输入一个字符串响应:

import socket
def respond(client):
    response = input("Enter a value: ")
    client.send(bytes(response, "utf8"))
    client.close()
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server.bind(("localhost", 2401))
server.listen(1)
try:
    while True:
        client, addr = server.accept()
        respond(client)
finally:
    server.close()

respond函数接受一个socket参数并提示要发送的数据作为回复,然后发送它。要使用它,我们构建一个服务器套接字,并告诉它在本地计算机上的端口2401上进行监听(我随机选择了端口)。当客户端连接时,它调用respond函数,该函数交互式地请求数据并做出适当的响应。需要注意的重要事情是,respond函数只关心套接字接口的两种方法:sendclose

为了测试这一点,我们可以编写一个非常简单的客户端,连接到相同的端口并在退出之前输出响应:

import socket
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(("localhost", 2401))
print("Received: {0}".format(client.recv(1024)))
client.close()

要使用这些程序,请按照以下步骤进行:

  1. 在一个终端中启动服务器。
  2. 打开第二个终端窗口并运行客户端。
  3. 在服务器窗口的“输入值:”提示处,输入一个值并按Enter键。
  4. 客户端将接收您输入的内容,将其打印到控制台上,并退出。再次运行客户端;服务器将提示输入第二个值。

结果将看起来像这样:


现在,回顾我们的服务器代码,我们看到了两个部分。respond函数将数据发送到一个socket对象中。剩下的脚本负责创建该socket对象。我们将创建一对装饰器,定制套接字的行为,而无需扩展或修改套接字本身。

让我们从一个logging装饰器开始。这个对象在将数据发送到客户端之前,将任何数据输出到服务器的控制台上:

class LogSocket:
    def __init__(self, socket):
        self.socket = socket
    def send(self, data):
        print(
            "Sending {0} to {1}".format(
                data, self.socket.getpeername()[0]
            )
        )
        self.socket.send(data)
    def close(self):
        self.socket.close()

这个类装饰了一个socket对象,并向客户端 socket 呈现sendclose接口。一个更好的装饰器还应该实现(可能定制)所有剩余的socket方法。它还应该正确地实现send的所有参数(实际上还接受一个可选的 flags 参数),但让我们保持我们的例子简单。每当在这个对象上调用send时,它都会在将数据发送到客户端之前将输出记录到屏幕上,使用原始 socket。

我们只需要改变原始代码中的一行,就可以使用这个装饰器。我们不再用 socket 调用respond,而是用一个装饰过的 socket 调用它:

respond(LogSocket(client)) 

虽然这很简单,但我们必须问自己,为什么我们不只是扩展socket类并覆盖send方法。我们可以调用super().send在记录后进行实际发送。这种设计也没有问题。

当面临装饰器和继承之间的选择时,只有在我们需要根据某些条件动态修改对象时,才应该使用装饰器。例如,我们可能只想在服务器当前处于调试模式时启用日志装饰器。当我们有多个可选行为时,装饰器也比多重继承更胜一筹。例如,我们可以编写第二个装饰器,每当调用send时,就使用gzip压缩数据:

import gzip
from io import BytesIO
class GzipSocket:
    def __init__(self, socket):
        self.socket = socket
    def send(self, data):
        buf = BytesIO()
        zipfile = gzip.GzipFile(fileobj=buf, mode="w")
        zipfile.write(data)
        zipfile.close()
        self.socket.send(buf.getvalue())
    def close(self):
        self.socket.close()

在这个版本中,send方法在发送到客户端之前压缩传入的数据。

现在我们有了这两个装饰器,我们可以编写代码,在响应时动态地在它们之间切换。这个例子并不完整,但它说明了我们可能遵循的逻辑来混合和匹配装饰器:

client, addr = server.accept() 
        if log_send: 
            client = LogSocket(client) 
        if client.getpeername()[0] in compress_hosts: 
            client = GzipSocket(client) 
        respond(client) 

这段代码检查一个名为log_send的假设配置变量。如果启用了,它会将 socket 包装在LogSocket装饰器中。类似地,它检查连接的客户端是否在已知接受压缩内容的地址列表中。如果是,它会将客户端包装在GzipSocket装饰器中。请注意,这两个装饰器中的任何一个、两个或全部都可能被启用,这取决于配置和连接的客户端。尝试使用多重继承来编写这个,并看看你会有多困惑!

Python 中的装饰器

装饰器模式在 Python 中很有用,但也有其他选择。例如,我们可以使用 monkey-patching(例如,socket.socket.send = log_send)来获得类似的效果。单继承,其中可选的计算在一个大方法中完成,可能是一个选择,而多继承不应该被写入,只是因为它不适用于先前看到的特定示例。

在 Python 中,很常见在函数上使用这种模式。正如我们在前一章中看到的,函数也是对象。事实上,函数装饰是如此常见,以至于 Python 提供了一种特殊的语法,使得将这种装饰器应用到函数变得容易。

例如,我们可以更一般地看待日志示例。我们可能会发现,不仅仅是在 socket 上发送调用时记录,记录所有对某些函数或方法的调用可能会有所帮助。以下示例实现了一个装饰器,正是这样做的:

import time
def log_calls(func):
    def wrapper(*args, **kwargs):
        now = time.time()
        print(
            "Calling {0} with {1} and {2}".format(
                func.__name__, args, kwargs
            )
        )
        return_value = func(*args, **kwargs)
        print(
            "Executed {0} in {1}ms".format(
                func.__name__, time.time() - now
            )
        )
        return return_value
    return wrapper
def test1(a, b, c):
    print("\ttest1 called")
def test2(a, b):
    print("\ttest2 called")
def test3(a, b):
    print("\ttest3 called")
    time.sleep(1)
test1 = log_calls(test1)
test2 = log_calls(test2)
test3 = log_calls(test3)
test1(1, 2, 3)
test2(4, b=5)
test3(6, 7)

这个装饰器函数与我们之前探讨的示例非常相似;在这些情况下,装饰器接受一个类似 socket 的对象并创建一个类似 socket 的对象。这次,我们的装饰器接受一个函数对象并返回一个新的函数对象。这段代码包括三个单独的任务:

  • 一个函数,log_calls,接受另一个函数
  • 这个函数定义了(内部)一个名为wrapper的新函数,在调用原始函数之前做一些额外的工作
  • 内部函数从外部函数返回

三个示例函数演示了装饰器的使用。第三个函数包括一个sleep调用来演示定时测试。我们将每个函数传递给装饰器,它返回一个新函数。我们将这个新函数赋给原始变量名,有效地用装饰后的函数替换了原始函数。

这种语法允许我们动态构建装饰函数对象,就像我们在套接字示例中所做的那样。如果我们不替换名称,我们甚至可以为不同情况保留装饰和非装饰版本。

通常,这些装饰器是应用于不同函数的永久性通用修改。在这种情况下,Python 支持一种特殊的语法,在函数定义时应用装饰器。我们已经在一些地方看到了这种语法;现在,让我们了解一下它是如何工作的。

我们可以使用@decorator语法一次完成所有操作,而不是在方法定义之后应用装饰器函数:

@log_calls 
def test1(a,b,c): 
    print("\ttest1 called") 

这种语法的主要好处是,我们可以很容易地看到在阅读函数定义时函数已经被装饰。如果装饰器是后来应用的,那么阅读代码的人可能会错过函数已经被修改的事实。回答类似“为什么我的程序将函数调用记录到控制台?”这样的问题可能会变得更加困难!但是,这种语法只能应用于我们定义的函数,因为我们无法访问其他模块的源代码。如果我们需要装饰第三方库中的函数,我们必须使用之前的语法。

装饰器语法还有更多我们在这里没有看到的内容。我们没有足够的空间来涵盖这里的高级主题,所以请查看 Python 参考手册或其他教程以获取更多信息。装饰器可以被创建为可调用对象,而不仅仅是返回函数的函数。类也可以被装饰;在这种情况下,装饰器返回一个新类,而不是一个新函数。最后,装饰器可以接受参数,以便根据每个函数的情况进行自定义。

观察者模式

观察者模式对于状态监控和事件处理非常有用。这种模式允许一个给定的对象被未知和动态的观察者对象监视。

每当核心对象上的值发生变化时,它都会通过调用update()方法来通知所有观察者对象发生了变化。每个观察者在核心对象发生变化时可能负责不同的任务;核心对象不知道也不关心这些任务是什么,观察者通常也不知道也不关心其他观察者在做什么。

这是它在 UML 中的表示:


观察者模式示例

观察者模式可能在冗余备份系统中很有用。我们可以编写一个维护特定值的核心对象,然后有一个或多个观察者创建该对象的序列化副本。例如,这些副本可以存储在数据库中,存储在远程主机上,或者存储在本地文件中。让我们使用属性来实现核心对象:

class Inventory:
    def __init__(self):
        self.observers = []
        self._product = None
        self._quantity = 0
    def attach(self, observer):
        self.observers.append(observer)
    @property
    def product(self):
        return self._product
    @product.setter
    def product(self, value):
        self._product = value
        self._update_observers()
    @property
    def quantity(self):
        return self._quantity
    @quantity.setter
    def quantity(self, value):
        self._quantity = value
 self._update_observers()
 def _update_observers(self):
 for observer in self.observers:
 observer()

这个对象有两个属性,当设置时,会调用自身的_update_observers方法。这个方法所做的就是循环遍历任何注册的观察者,并让每个观察者知道发生了一些变化。在这种情况下,我们直接调用观察者对象;对象将必须实现__call__来处理更新。这在许多面向对象的编程语言中是不可能的,但在 Python 中是一个有用的快捷方式,可以帮助我们使我们的代码更易读。

现在让我们实现一个简单的观察者对象;这个对象只会将一些状态打印到控制台上:

class ConsoleObserver: 
    def __init__(self, inventory): 
        self.inventory = inventory 
    def __call__(self): 
        print(self.inventory.product) 
        print(self.inventory.quantity) 

这里没有什么特别激动人心的东西;观察到的对象在初始化程序中设置,当观察者被调用时,我们会执行某些操作。我们可以在交互式控制台中测试观察者:

>>> i = Inventory()
    >>> c = ConsoleObserver(i)
    >>> i.attach(c)
    >>> i.product = "Widget"
    Widget
    0
    >>> i.quantity = 5
    Widget
    5  

将观察者附加到Inventory对象后,每当我们更改两个观察属性中的一个时,观察者都会被调用并执行其操作。我们甚至可以添加两个不同的观察者实例:

>>> i = Inventory()
    >>> c1 = ConsoleObserver(i)
    >>> c2 = ConsoleObserver(i)
    >>> i.attach(c1)
    >>> i.attach(c2)
    >>> i.product = "Gadget"
    Gadget
    0
    Gadget
    0  

这次当我们改变产品时,有两套输出,每个观察者一个。这里的关键思想是我们可以轻松地添加完全不同类型的观察者,同时备份数据到文件、数据库或互联网应用程序。

观察者模式将被观察的代码与观察的代码分离。如果我们不使用这种模式,我们将不得不在每个属性中放置代码来处理可能出现的不同情况;记录到控制台、更新数据库或文件等。所有这些任务的代码都将与被观察的对象混在一起。维护它将是一场噩梦,并且在以后添加新的监视功能将是痛苦的。

策略模式

策略模式是面向对象编程中抽象的常见演示。该模式实现了单个问题的不同解决方案,每个解决方案都在不同的对象中。客户端代码可以在运行时动态选择最合适的实现。

通常,不同的算法有不同的权衡;一个可能比另一个更快,但使用了更多的内存,而第三个算法可能在多个 CPU 存在或提供分布式系统时最合适。以下是 UML 中的策略模式:


用户连接到策略模式的代码只需要知道它正在处理抽象接口。所选择的实际实现以不同的方式执行相同的任务;无论如何,接口都是相同的。

策略示例

策略模式的典型示例是排序例程;多年来,已经发明了许多用于对对象集合进行排序的算法;快速排序、归并排序和堆排序都是快速排序算法,具有不同的特性,每种都有其自身的用途,取决于输入的大小和类型,它们的顺序有多乱,以及系统的要求。

如果我们有需要对集合进行排序的客户端代码,我们可以将其传递给具有sort()方法的对象。这个对象可以是QuickSorterMergeSorter对象,但结果在任何情况下都是相同的:一个排序好的列表。用于进行排序的策略被抽象出来,使其模块化和可替换。

当然,在 Python 中,我们通常只是调用sorted函数或list.sort方法,并相信它会以接近最佳的方式进行排序。因此,我们确实需要看一个更好的例子。

让我们考虑一个桌面壁纸管理器。当图像显示在桌面背景上时,可以以不同的方式调整到屏幕大小。例如,假设图像比屏幕小,可以在屏幕上平铺、居中或缩放以适应。

还有其他更复杂的策略可以使用,例如缩放到最大高度或宽度,将其与实心、半透明或渐变背景颜色相结合,或其他操作。虽然我们可能希望稍后添加这些策略,但让我们从基本的开始。

我们的策略对象需要两个输入;要显示的图像和屏幕宽度和高度的元组。它们每个都返回一个新的屏幕大小的图像,图像根据给定的策略进行调整。您需要使用pip3 install pillow安装pillow模块才能使此示例工作:

from PIL import Image
class TiledStrategy:
    def make_background(self, img_file, desktop_size):
        in_img = Image.open(img_file)
        out_img = Image.new("RGB", desktop_size)
        num_tiles = [
            o // i + 1 for o, i in zip(out_img.size, in_img.size)
        ]
        for x in range(num_tiles[0]):
            for y in range(num_tiles[1]):
                out_img.paste(
                    in_img,
                    (
                        in_img.size[0] * x,
                        in_img.size[1] * y,
                        in_img.size[0] * (x + 1),
                        in_img.size[1] * (y + 1),
                    ),
                )
        return out_img
class CenteredStrategy:
    def make_background(self, img_file, desktop_size):
        in_img = Image.open(img_file)
        out_img = Image.new("RGB", desktop_size)
        left = (out_img.size[0] - in_img.size[0]) // 2
        top = (out_img.size[1] - in_img.size[1]) // 2
        out_img.paste(
            in_img,
            (left, top, left + in_img.size[0], top + in_img.size[1]),
        )
        return out_img
class ScaledStrategy:
    def make_background(self, img_file, desktop_size):
        in_img = Image.open(img_file)
        out_img = in_img.resize(desktop_size)
        return out_img

在这里,我们有三种策略,每种策略都使用PIL来执行它们的任务。各个策略都有一个make_background方法,接受相同的参数集。一旦选择,就可以调用适当的策略来创建正确大小的桌面图像。TiledStrategy循环遍历可以适应图像宽度和高度的输入图像数量,并将其重复复制到每个位置。CenteredStrategy计算出需要在图像的四个边缘留下多少空间来使其居中。ScaledStrategy将图像强制缩放到输出大小(忽略纵横比)。

考虑一下,如果没有策略模式,如何在这些选项之间进行切换的实现。我们需要把所有的代码放在一个很大的方法中,并使用一个笨拙的if语句来选择预期的选项。每次我们想要添加一个新的策略,我们都必须使方法变得更加笨拙。

Python 中的策略

策略模式的前面的经典实现,在大多数面向对象的库中非常常见,但在 Python 编程中很少见。

这些类分别代表什么都不做,只提供一个函数的对象。我们可以轻松地将该函数称为__call__,并直接使对象可调用。由于对象没有与之关联的其他数据,我们只需要创建一组顶层函数并将它们作为我们的策略传递。

因此,设计模式哲学的反对者会说,因为 Python 具有一流函数,策略模式是不必要的。事实上,Python 的一流函数使我们能够以更直接的方式实现策略模式。知道这种模式的存在仍然可以帮助我们选择程序的正确设计,但是使用更可读的语法来实现它。当我们需要允许客户端代码或最终用户从相同接口的多个实现中进行选择时,应该使用策略模式或其顶层函数实现。

状态模式

状态模式在结构上类似于策略模式,但其意图和目的非常不同。状态模式的目标是表示状态转换系统:在这些系统中,很明显对象可以处于特定状态,并且某些活动可能会将其驱动到不同的状态。

为了使其工作,我们需要一个管理器或上下文类,提供切换状态的接口。在内部,这个类包含对当前状态的指针。每个状态都知道它被允许处于什么其他状态,并且将根据在其上调用的操作而转换到这些状态。

因此,我们有两种类型的类:上下文类和多个状态类。上下文类维护当前状态,并将操作转发给状态类。状态类通常对于调用上下文的任何其他对象都是隐藏的;它就像一个黑匣子,恰好在内部执行状态管理。在 UML 中的样子如下:


状态示例

为了说明状态模式,让我们构建一个 XML 解析工具。上下文类将是解析器本身。它将以字符串作为输入,并将工具置于初始解析状态。各种解析状态将吃掉字符,寻找特定的值,当找到该值时,转换到不同的状态。目标是为每个标签及其内容创建一个节点对象树。为了使事情更容易管理,我们只解析 XML 的一个子集 - 标签和标签名称。我们将无法处理标签上的属性。它将解析标签的文本内容,但不会尝试解析混合内容,其中包含文本内的标签。这是一个我们将能够解析的简化 XML文件的示例:

<book> 
    <author>Dusty Phillips</author> 
    <publisher>Packt Publishing</publisher> 
    <title>Python 3 Object Oriented Programming</title> 
    <content> 
        <chapter> 
            <number>1</number> 
            <title>Object Oriented Design</title> 
        </chapter> 
        <chapter> 
            <number>2</number> 
            <title>Objects In Python</title> 
        </chapter> 
    </content> 
</book> 

在我们查看状态和解析器之前,让我们考虑一下这个程序的输出。我们知道我们想要一个Node对象的树,但Node是什么样子呢?它显然需要知道它正在解析的标签的名称,而且由于它是一棵树,它可能应该保持对父节点的指针和按顺序列出节点的子节点的列表。有些节点有文本值,但不是所有节点都有。让我们首先看看这个Node类:

class Node:
    def __init__(self, tag_name, parent=None):
        self.parent = parent
        self.tag_name = tag_name
        self.children = []
        self.text = ""
    def __str__(self):
        if self.text:
            return self.tag_name + ": " + self.text
        else:
            return self.tag_name

这个类在初始化时设置默认属性值。提供__str__方法来帮助在完成时可视化树结构。

现在,看看示例文档,我们需要考虑我们的解析器可以处于哪些状态。显然,它将开始于尚未处理任何节点的状态。我们需要一个用于处理开放标签和关闭标签的状态。当我们在具有文本内容的标签内部时,我们还需要将其处理为单独的状态。

状态转换可能会很棘手;我们如何知道下一个节点是开放标签、关闭标签还是文本节点?我们可以在每个状态中放入一些逻辑来解决这个问题,但实际上创建一个唯一目的是确定下一个状态的新状态更有意义。如果我们将这个过渡状态称为ChildNode,我们最终得到以下状态:

  • FirstTag
  • ChildNode
  • OpenTag
  • CloseTag
  • Text

FirstTag状态将切换到ChildNode,它负责决定要切换到其他三个状态中的哪一个;当这些状态完成时,它们将切换回ChildNode。以下状态转换图显示了可用的状态变化:


状态负责获取字符串的剩余部分,处理尽可能多的内容,然后告诉解析器处理其余部分。让我们首先构建Parser类:

class Parser: 
    def __init__(self, parse_string): 
        self.parse_string = parse_string 
        self.root = None 
        self.current_node = None 
        self.state = FirstTag() 
    def process(self, remaining_string): 
        remaining = self.state.process(remaining_string, self) 
        if remaining: 
            self.process(remaining) 
    def start(self): 
        self.process(self.parse_string) 

初始化程序在类上设置了一些变量,这些变量将由各个状态访问。parse_string实例变量是我们试图解析的文本。root节点是 XML 结构中的顶部节点。current_node实例变量是我们当前正在向其添加子节点的节点。

这个解析器的重要特性是process方法,它接受剩余的字符串,并将其传递给当前状态。解析器(self参数)也被传递到状态的process方法中,以便状态可以操作它。当状态完成处理时,预期状态将返回未解析字符串的剩余部分。然后解析器递归调用这个剩余字符串上的process方法来构造树的其余部分。

现在让我们来看一下FirstTag状态:

class FirstTag:
    def process(self, remaining_string, parser):
        i_start_tag = remaining_string.find("<")
        i_end_tag = remaining_string.find(">")
        tag_name = remaining_string[i_start_tag + 1 : i_end_tag]
        root = Node(tag_name)
 parser.root = parser.current_node = root
 parser.state = ChildNode()
        return remaining_string[i_end_tag + 1 :]

这个状态找到了第一个标签的开放和关闭尖括号的索引(i_代表索引)。您可能认为这个状态是多余的,因为 XML 要求在开放标签之前没有文本。然而,可能需要消耗空白字符;这就是为什么我们搜索开放尖括号而不是假设它是文档中的第一个字符。

请注意,此代码假定输入文件有效。一个正确的实现将严格测试无效输入,并尝试恢复或显示极具描述性的错误消息。

该方法提取标签的名称并将其分配给解析器的根节点。它还将其分配给current_node,因为那是我们接下来要添加子节点的节点。

然后是重要的部分:该方法将解析器对象上的当前状态更改为ChildNode状态。然后返回字符串的剩余部分(在开放标签之后)以允许其被处理。

看起来相当复杂的ChildNode状态实际上只需要一个简单的条件:

class ChildNode: 
    def process(self, remaining_string, parser): 
        stripped = remaining_string.strip() 
        if stripped.startswith("</"): 
 parser.state = CloseTag() 
        elif stripped.startswith("<"): 
 parser.state = OpenTag() 
        else: 
 parser.state = TextNode() 
        return stripped 

strip()调用从字符串中删除空白。然后解析器确定下一个项是开放标签、关闭标签还是文本字符串。根据发生的可能性,它将解析器设置为特定状态,然后告诉它解析字符串的其余部分。

OpenTag状态类似于FirstTag状态,只是它将新创建的节点添加到先前的current_node对象的children中,并将其设置为新的current_node。然后继续将处理器放回ChildNode状态:

class OpenTag:
    def process(self, remaining_string, parser):
        i_start_tag = remaining_string.find("<")
        i_end_tag = remaining_string.find(">")
        tag_name = remaining_string[i_start_tag + 1 : i_end_tag]
        node = Node(tag_name, parser.current_node)
 parser.current_node.children.append(node)
 parser.current_node = node
 parser.state = ChildNode()
        return remaining_string[i_end_tag + 1 :]

CloseTag状态基本上做相反的事情;它将解析器的current_node设置回父节点,以便在外部标签中添加任何进一步的子节点:

class CloseTag:
    def process(self, remaining_string, parser):
        i_start_tag = remaining_string.find("<")
        i_end_tag = remaining_string.find(">")
        assert remaining_string[i_start_tag + 1] == "/"
        tag_name = remaining_string[i_start_tag + 2 : i_end_tag]
        assert tag_name == parser.current_node.tag_name
 parser.current_node = parser.current_node.parent
 parser.state = ChildNode()
        return remaining_string[i_end_tag + 1 :].strip()

两个assert语句有助于确保解析字符串是一致的。

最后,TextNode状态非常简单地提取下一个关闭标签之前的文本,并将其设置为当前节点的值:

class TextNode: 
    def process(self, remaining_string, parser): 
        i_start_tag = remaining_string.find('<') 
        text = remaining_string[:i_start_tag] 
 parser.current_node.text = text 
        parser.state = ChildNode() 
        return remaining_string[i_start_tag:] 

现在我们只需要在创建的解析器对象上设置初始状态。初始状态是一个FirstTag对象,所以只需将以下内容添加到__init__方法中:

self.state = FirstTag() 

为了测试这个类,让我们添加一个主脚本,从命令行打开一个文件,解析它,并打印节点:

if __name__ == "__main__": 
    import sys 
    with open(sys.argv[1]) as file: 
        contents = file.read() 
        p = Parser(contents) 
        p.start() 
        nodes = [p.root] 
        while nodes: 
            node = nodes.pop(0) 
            print(node) 
            nodes = node.children + nodes 

这段代码打开文件,加载内容,并解析结果。然后按顺序打印每个节点及其子节点。我们最初在node类上添加的__str__方法负责格式化节点以供打印。如果我们在之前的示例上运行脚本,它将输出树如下:

book
    author: Dusty Phillips
    publisher: Packt Publishing
    title: Python 3 Object Oriented Programming
    content
    chapter
    number: 1
    title: Object Oriented Design
    chapter
    number: 2
    title: Objects In Python  

将这与原始简化的 XML 文档进行比较告诉我们解析器正在工作。

状态与策略

状态模式看起来与策略模式非常相似;实际上,两者的 UML 图是相同的。实现也是相同的。我们甚至可以将我们的状态编写为一等函数,而不是将它们包装在对象中,就像为策略建议的那样。

虽然这两种模式具有相同的结构,但它们解决完全不同的问题。策略模式用于在运行时选择算法;通常,只有一个算法会被选择用于特定用例。另一方面,状态模式旨在允许在某个过程发展时动态地在不同状态之间切换。在代码中,主要区别在于策略模式通常不知道其他策略对象。在状态模式中,状态或上下文需要知道它可以切换到哪些其他状态。

状态转换作为协程

状态模式是解决状态转换问题的经典面向对象解决方案。然而,您可以通过将对象构建为协程来获得类似的效果。还记得我们在第二十一章中构建的正则表达式日志文件解析器吗?那实际上是一个伪装的状态转换问题。该实现与定义状态模式中使用的所有对象(或函数)的实现之间的主要区别在于,协程解决方案允许我们在语言构造中编码更多的样板。有两种实现,但没有一种本质上比另一种更好。状态模式实际上是我考虑在asyncio之外使用协程的唯一场合。

单例模式

单例模式是最具争议的模式之一;许多人指责它是一种反模式,一种应该避免而不是推广的模式。在 Python 中,如果有人使用单例模式,他们几乎肯定是在做错事情,可能是因为他们来自一个更严格的编程语言。

那么,为什么要讨论它呢?单例是所有设计模式中最著名的之一。它在过度面向对象的语言中很有用,并且是传统面向对象编程的重要部分。更相关的是,单例背后的想法是有用的,即使我们在 Python 中以完全不同的方式实现了这个概念。

单例模式背后的基本思想是允许某个对象的确切实例只存在一个。通常,这个对象是一种类似于我们在第十九章中讨论的管理类。这些对象通常需要被各种其他对象引用,并且将对管理对象的引用传递给需要它们的方法和构造函数可能会使代码难以阅读。

相反,当使用单例时,独立的对象从类中请求管理对象的单个实例,因此无需传递对它的引用。UML 图表并没有完全描述它,但为了完整起见,这里是它:


在大多数编程环境中,通过使构造函数私有(这样就没有人可以创建它的其他实例),然后提供一个静态方法来检索单个实例来强制实施单例。这个方法在第一次调用时创建一个新实例,然后对所有后续调用返回相同的实例。


Python 入门指南(七)(2)https://developer.aliyun.com/article/1507459

相关文章
|
13天前
|
数据采集 存储 XML
Python爬虫定义入门知识
Python爬虫是用于自动化抓取互联网数据的程序。其基本概念包括爬虫、请求、响应和解析。常用库有Requests、BeautifulSoup、Scrapy和Selenium。工作流程包括发送请求、接收响应、解析数据和存储数据。注意事项包括遵守Robots协议、避免过度请求、处理异常和确保数据合法性。Python爬虫强大而灵活,但使用时需遵守法律法规。
|
14天前
|
Python
深入理解Python装饰器:从入门到实践####
本文旨在通过简明扼要的方式,为读者揭开Python装饰器的神秘面纱,从基本概念、工作原理到实际应用场景进行全面解析。不同于常规的摘要仅概述内容概要,本文将直接以一段精炼代码示例开篇,展示装饰器如何优雅地增强函数功能,激发读者探索兴趣,随后深入探讨其背后的机制与高级用法。 ####
45 11
|
10天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
10天前
|
机器学习/深度学习 数据挖掘 Python
Python编程入门——从零开始构建你的第一个程序
【10月更文挑战第39天】本文将带你走进Python的世界,通过简单易懂的语言和实际的代码示例,让你快速掌握Python的基础语法。无论你是编程新手还是想学习新语言的老手,这篇文章都能为你提供有价值的信息。我们将从变量、数据类型、控制结构等基本概念入手,逐步过渡到函数、模块等高级特性,最后通过一个综合示例来巩固所学知识。让我们一起开启Python编程之旅吧!
|
10天前
|
存储 Python
Python编程入门:打造你的第一个程序
【10月更文挑战第39天】在数字时代的浪潮中,掌握编程技能如同掌握了一门新时代的语言。本文将引导你步入Python编程的奇妙世界,从零基础出发,一步步构建你的第一个程序。我们将探索编程的基本概念,通过简单示例理解变量、数据类型和控制结构,最终实现一个简单的猜数字游戏。这不仅是一段代码的旅程,更是逻辑思维和问题解决能力的锻炼之旅。准备好了吗?让我们开始吧!
|
16天前
|
Java 测试技术 持续交付
【入门思路】基于Python+Unittest+Appium+Excel+BeautifulReport的App/移动端UI自动化测试框架搭建思路
本文重点讲解如何搭建App自动化测试框架的思路,而非完整源码。主要内容包括实现目的、框架设计、环境依赖和框架的主要组成部分。适用于初学者,旨在帮助其快速掌握App自动化测试的基本技能。文中详细介绍了从需求分析到技术栈选择,再到具体模块的封装与实现,包括登录、截图、日志、测试报告和邮件服务等。同时提供了运行效果的展示,便于理解和实践。
60 4
【入门思路】基于Python+Unittest+Appium+Excel+BeautifulReport的App/移动端UI自动化测试框架搭建思路
|
10天前
|
设计模式 缓存 开发框架
Python中的装饰器:从入门到实践####
本文深入探讨了Python中装饰器的工作原理与应用,通过具体案例展示了如何利用装饰器增强函数功能、提高代码复用性和可读性。读者将学习到装饰器的基本概念、实现方法及其在实际项目开发中的实用技巧。 ####
21 3
|
13天前
|
机器学习/深度学习 数据采集 数据可视化
Python在数据科学中的应用:从入门到实践
本文旨在为读者提供一个Python在数据科学领域应用的全面概览。我们将从Python的基础语法开始,逐步深入到数据处理、分析和可视化的高级技术。文章不仅涵盖了Python中常用的数据科学库,如NumPy、Pandas和Matplotlib,还探讨了机器学习库Scikit-learn的使用。通过实际案例分析,本文将展示如何利用Python进行数据清洗、特征工程、模型训练和结果评估。此外,我们还将探讨Python在大数据处理中的应用,以及如何通过集成学习和深度学习技术来提升数据分析的准确性和效率。
|
12天前
|
机器学习/深度学习 数据挖掘 开发者
Python编程入门:理解基础语法与编写第一个程序
【10月更文挑战第37天】本文旨在为初学者提供Python编程的初步了解,通过简明的语言和直观的例子,引导读者掌握Python的基础语法,并完成一个简单的程序。我们将从变量、数据类型到控制结构,逐步展开讲解,确保即使是编程新手也能轻松跟上。文章末尾附有完整代码示例,供读者参考和实践。
|
12天前
|
人工智能 数据挖掘 程序员
Python编程入门:从零到英雄
【10月更文挑战第37天】本文将引导你走进Python编程的世界,无论你是初学者还是有一定基础的开发者,都能从中受益。我们将从最基础的语法开始讲解,逐步深入到更复杂的主题,如数据结构、面向对象编程和网络编程等。通过本文的学习,你将能够编写出自己的Python程序,实现各种功能。让我们一起踏上Python编程之旅吧!
下一篇
无影云桌面