一日一技:使用装饰器实现类属性的懒加载

简介: 一日一技:使用装饰器实现类属性的懒加载

假设我们有一个工具类MongoUtil,它的作用是封装一些数据库操作。例如:

1. import pymongo
1. 
2. class MongoUtil:
3.     def __init__(self):
4.         connect = pymongo.MongoClient()
5.         db = connect.tieba
6.         self.post = db.post
7.         self.user = db.user
8. 
9.     def write_post(self, post):
10.         # 处理post信息
11.         self.post.insert_one(post)
12. 
13.     def read_user_info(self):
14.         rows = self.user.find()
15.         # 读取user信息并处理
16.         # ...

我们发现这样写有一个问题——类在初始化的时候,就会创建数据库的链接。但我们并不是在类刚刚初始化时就读写数据库。

为了让数据库在第一次使用时再创建连接,我们就要实现懒加载机制:

import pymongo
class MongoUtil:
    def __init__(self):
        connect = pymongo.MongoClient()
        self.db = connect.tieba
        self.post = None
        self.user = None
    def write_post(self, post):
        # 处理post信息
        if not self.post:
            self.post = self.db.post
        self.post.insert_one(post)
    def read_user_info(self):
        if not self.user:
            self.user = self.db.user
        rows = self.user.find()
        # 读取user信息并处理
        # ...

这样写确实实现了懒加载,但每一个操作都需要判断当前是否连接到了对应的集合中。这样就会出现大量的重复代码。

为了解决这个问题,我们可以使用装饰器实现一个懒加载机制:

import pymongo
class lazy:
    def __init__(self, func):
        self.func = func
    def __get__(self, instance, cls):
        if instance is None:
            return self
        else:
            value = self.func(instance)
            setattr(instance, self.func.__name__, value)
            return value
class MongoUtil:
    def __init__(self):
        connect = pymongo.MongoClient()
        self.db = connect.tieba
    @lazy
    def post(self):
        return self.db.post
    @lazy
    def user(self):
        return self.db.user
    def write_post(self, post):
        # 处理post信息
        self.post.insert_one(post)
    def read_user_info(self):
        rows = self.user.find()
        # 读取user信息并处理
        # ...

我们实现了一个装饰器类 lazy来装饰两个类属性 postuser。当 self.post第一次被调用时,它会正常连接集合,当第二次或以上访问 self.post时,就会直接使用第一次返回的对象,不会再次连接MongoDB的集合。 self.user同理。

我们来测试一下,如下图所示。

可以看到,第二次调用 self.post时,并没有打印出 第一次访问self.post,因为第二次会直接使用之前的缓存。

最后,特别说明:本文使用MongoDB举例只是为了说明基于装饰器的类属性懒加载的代码写法。而实际上, pymongo已经自动实现了懒加载机制,当我们直接 connect.tieba.post时,它并不会真的去连接MongoDB,只有当我们要增删改查集合里面的数据时,pymongo才会创建连接。

目录
相关文章
|
存储 物联网 测试技术
在16G的GPU上微调Mixtral-8x7B
Mixtral-8x7B是最好的开源llm之一。但是消费级硬件上对其进行微调也是非常具有挑战性的。因为模型需要96.8 GB内存。而微调则需要更多的内存来存储状态和训练数据。比如说80gb RAM的H100 GPU是不够的。
227 2
|
存储 缓存 算法
使用Mixtral-offloading在消费级硬件上运行Mixtral-8x7B
Mixtral-8x7B是最好的开放大型语言模型(LLM)之一,但它是一个具有46.7B参数的庞大模型。即使量化为4位,该模型也无法在消费级GPU上完全加载(例如,24 GB VRAM是不够的)。
374 4
|
机器学习/深度学习 人工智能 负载均衡
基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化
本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型(LLM)实现与训练优化上的创新工作。
|
人工智能 API 数据中心
NVIDIA破局第二曲线创新问题之Megatron Core的定义如何解决
NVIDIA破局第二曲线创新问题之Megatron Core的定义如何解决
193 0
|
存储 人工智能 并行计算
Pai-Megatron-Patch:围绕Megatron-Core打造大模型训练加速生态
Pai-Megatron-Patch(https://github.com/alibaba/Pai-Megatron-Patch)是阿里云人工智能平台PAI研发的围绕Nvidia MegatronLM的大模型开发配套工具,旨在帮助开发者快速上手大模型,完成大模型(LLM)相关的高效分布式训练,有监督指令微调,下游任务评估等大模型开发链路。最近一年来,我们持续打磨Pai-Megatron-Patch的性能和扩展功能,围绕Megatron-Core(以下简称MCore)进一步打造大模型训练加速技术生态,推出更多的的训练加速、显存优化特性。
|
11月前
|
测试技术 Apache
mixtral大模型
Mixtral 是一种具有开放权重的高质量稀疏专家混合模型 (SMoE)。根据 Apache 2.0 许可。 Mixtral 在大多数基准测试中都优于 Llama 2 70B,推理速度提高了 6 倍。它是最强大的开放权重模型,具有宽松的许可证,也是成本/性能权衡方面的最佳模型。
|
存储 机器学习/深度学习 人工智能
基于Megatron-Core的稀疏大模型训练工具:阿里云MoE大模型最佳实践
随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期以Mixtral为代表的MoE(多专家混合)大模型证明了稀疏MoE技术能大幅降低计算量、提升推理速度,模型效果甚至超过同规模稠密模型。阿里云PAI和NVIDIA团队深入合作,基于Megatron-Core MoE框架,解决了MoE大模型训练落地时会遇到的可拓展性、易用性、功能性以及收敛精度等核心问题,在下游任务上取得了很好的模型效果。
Mixtral MOE 部分源码解析
Mixtral MOE 部分源码解析
104 0
|
机器学习/深度学习 人工智能 物联网
Mixtral 8X7B MoE模型基于阿里云人工智能平台PAI实践合集
本文介绍如何在PAI平台针对Mixtral 8x7B大模型的微调和推理服务的最佳实践,助力AI开发者快速开箱。以下我们将分别展示具体使用步骤。
|
Python
Python面向对象、类的抽象、类的定义、类名遵循大驼峰的命名规范创建对象、类外部添加和获取对象属性、类内部操作属性魔法方法__init__()__str__()__del__()__repr__()
面向对象和面向过程,是两种编程思想. 编程思想是指对待同一个问题,解决问题的套路方式.面向过程: 注重的过程,实现的细节.亲力亲为.面向对象: 关注的是结果, 偷懒.类和对象,是面向对象中非常重要的两个概念object 是所有的类基类,即最初始的类class 类名(object): 类中的代码PEP8代码规范:类定义的前后,需要两个空行 创建的对象地址值都不一样如dog和dog1的地址就不一样,dog的地址为2378043254528dog1的地址为2378044849840 8.类内部操作属性 sel
390 1
Python面向对象、类的抽象、类的定义、类名遵循大驼峰的命名规范创建对象、类外部添加和获取对象属性、类内部操作属性魔法方法__init__()__str__()__del__()__repr__()