【Pytorch神经网络实战案例】13 构建变分自编码神经网络模型生成Fashon-MNST模拟数据

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 为输出分布与标准高斯分布之间的KL散度距离。它与MSE算法一起构成变分自编码神经网络的损失函数。

815902569f6a467a99304f9ac1482386.png


1 变分自编码神经网络生成模拟数据案例说明


变分自编码里面真正的公式只有一个KL散度。


1.1 变分自编码神经网络模型介绍


主要由以下三个部分构成:


1.1.1 编码器


由两层全连接神经网络组成,第一层有784个维度的输入和256个维度的输出;第二层并列连接了两个全连接神经网络,每个网络都有两个维度的输出,输出的结果分别代表数据分布的均值与方差。


1.1.2 采样器


根据编码器得到的均值与方差计算出数据分布情况,从数据分布情况中采样取得数据特征z,并将z传递到两节点为开始的解码器部分。


1.1.3 解码器


由两个全连接神经网络构成,第一层有两个维度的输入和256个维度的输出;第二层有256个维度的输入和784哥维度的输出。


71a6f8f61f7c49058c1eb74b445dc7f4.png


1.采样器的左侧是编码器。


2.圆角方框是采样器部分,其工作步骤如下。(1)用lg_var.exp()方法算出真正的方差值。(2)用方差值的sqrt0方法执行开平方运算得到标准差。(3)在符合标准正态分布的空间里随意采样,得到一个具体的数。(4)将该数乘以标准差,再加上均值,得到符合编码器输出的数据分布(均值为mean、方差为sigma)集合中的一个点(sigma是指网络生成的lg_var经过变换后的值)。


3.采样器的右侧是解码器。 经过采样器之后所合成的点可以输入解码器进行模拟样本的生成。


1.1.4 小总结


在神经网络中,可以为模型的输出值赋于任意一个意义,并通过训练得到对应的关系。具体做法是:将代表该意义的值代入相应的公式(要求该公式必须能够支持返向传播),计算公式的输出值与目标值的误差,并将误差放到优化器里,然后通过多次选代的方式进行训练。


2 变分自编码神经网络模型的反向传播与KL散度的应用


变分自编码神经网络模型是假设编码器输出的数据分布属于高斯分布,只有在编码器能够输出符合高斯分布数据集的前提上,才可以将一个符合标准高斯分布中的点x通过mean+sigma × x的方式进行转化(mean表示均值、sigma表示标准差),完成在解码器输出空间中的采样功能。


2.1 变分自编码神经网络的损失函数


变分自编码神经网络的损失函数不但需要计算输出结果与输入之间的个体差异,而且需要计算输出分布与高斯分布之间的差异。


输出与输入之间的损失函数可以使用MSE算法来计算,输出分布与标准高斯分布之损失函数可以使用KL散度距离进行计算。


2.2 KL散度


KL散度是相对熵的意思。KL散度在本例中的应用可以理解为在模型的训练过程中令输出的数据分布与标准高斯分布之间的差距不断缩小。


设P(x)、Q(x)是离散随机变量集合X中取值x的两个概率分布函数,它们的结果分别为p和q,则p对q的相对熵如下:


add561c120af49a5b5b3030a9c6f08c6.png


由式可知,当P(x)和Q(x)两个概率分布函数相同时,相对熵为0(因为log1=0)并且相对熵具有不对称性,“Ep”代表期望,期望是指每次可能结果的概率乘以结果的总和。


将高斯分布的密度函数代入上式中,可以得到:


1f4533d4b8b8406ea72a8c61cdf71cf5.png


为输出分布与标准高斯分布之间的KL散度距离。它与MSE算法一起构成变分自编码神经网络的损失函数。


3 实例代码编写


3.1 代码实战:引入模块并载入样本----Variational_selfcoding.py(第1部分)


import torch
import torchvision
from cv2 import waitKey
from torch import nn
import torch.nn.functional as F
from torch.utils.data import DataLoader
from torchvision import transforms
import numpy as np
from scipy.stats import norm # 在模型可视化时使用该库的norm接口从标准的高斯分布中获取数值
import matplotlib.pylab as plt
import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'  # 可能是由于是MacOS系统的原因
# 1.1 引入模块并载入样本:定义基础函数,并且加载FashionMNIST数据集
# 定义样本预处理接口
img_transform = transforms.Compose([transforms.ToTensor()])
def to_img(x): # 将张量转化为图片
    x = 0.5 * (x + 1)
    x = x.clamp(0,1)
    x = x.reshape(x.size(0),1,28,28)
    return x
def imshow(img): # 显示图片
    npimg = img.numpy()
    plt.axis('off')
    plt.imshow(np.transpose(npimg,(1,2,0)))
    plt.show()
data_dir = './fashion_mnist/' # 加载数据集
train_dataset = torchvision.datasets.FashionMNIST(data_dir,train=True,transform=img_transform,download=True)
# 获取训练数据集
train_loader = DataLoader(train_dataset,batch_size=128,shuffle=True)
# 获取测试数据集
val_dataset = torchvision.datasets.FashionMNIST(data_dir,train=False,transform=img_transform)
test_dataset = DataLoader(val_dataset,batch_size=10,shuffle=False)
# 指定设备
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("所使用的设备为:",device)


3.2 代码实战:定义变分自编码神经网络的正向模型----Variational_selfcoding.py(第2部分)


# 1.2 定义变分自编码神经网络模型的正向结构
class VAE(nn.Module):
    def __init__(self,hidden_1=256,hidden_2=256,in_decode_dim=2,hidden_3=256):
        super(VAE, self).__init__()
        self.fc1 = nn.Linear(784, hidden_1)
        self.fc21 = nn.Linear(hidden_2, 2)
        self.fc22 = nn.Linear(hidden_2, 2)
        self.fc3 = nn.Linear(in_decode_dim, hidden_3)
        self.fc4 = nn.Linear(hidden_3, 784)
    def encode(self,x): # 编码器方法:使用两层全连接网络将输入的图片进行压缩,对第二层中两个神经网络的输出结果代表均值(mean)与取对数(log)以后的方差(lg_var)。
        h1 = F.relu(self.fc1(x))
        return self.fc21(h1),self.fc22(h1)
    def reparametrize(self,mean,lg_var): # 采样器方法:对方差(lg_var)进行还原,并从高斯分布中采样,将采样数值映射到编码器输出的数据分布中。
        std = lg_var.exp().sqrt()
        # torch.FloatTensor(std.size())的作用是,生成一个与std形状一样的张量。然后,调用该张量的normal_()方法,系统会对该张量中的每个元素在标准高斯空间(均值为0、方差为1)中进行采样。
        eps = torch.FloatTensor(std.size()).normal_().to(device) # 随机张量方法normal_(),完成高斯空间的采样过程。
        return eps.mul(std).add_(mean)
    # 在torch.FloatTensor()
    # 函数中,传入Tensor的size类型,返回的是一个同样为size的张量。假如std的size为[batch,dim],则返回形状为[batch,dim]的未初始化张量,等同于torch.FloatTensor(
    #     batch,dim),但不等同于torchFloatTensor([batch,dim),这是值得注意的地方。
    def decode(self,z): # 解码器方法:输入映射后的采样值,用两层神经网络还原出原始图片。
        h3 = F.relu(self.fc3(z))
        return self.fc4(h3)
    def forward(self,x,*arg): # 正向传播方法:将编码器,采样器,解码器串联起来,根据输入的原始图片生成模拟图片
        mean,lg_var = self.encode(x)
        z = self.reparametrize(mean=mean,lg_var=lg_var)
        return self.decode(z),mean,lg_var


3.3 代码实战:损失函数与训练函数的完善----Variational_selfcoding.py(第3部分)


# 1.3 完成损失函数和训练函数
reconstruction_function = nn.MSELoss(size_average=False)
def loss_function(recon_x,x,mean,lg_var): # 损失函数:将MSE的损失缩小到一半,再与KL散度相加,目的在于使得输出的模拟样本可以有更灵活的变化空间。
    MSEloss = reconstruction_function(recon_x,x) # MSE损失
    KLD = -0.5 * torch.sum(1 + lg_var -  mean.pow(2) - lg_var.exp())
    return 0.5 * MSEloss + KLD
def train(model,num_epochs = 50): # 训练函数
    optimizer = torch.optim.Adam(model.parameters(),lr=1e-3)
    display_step = 5
    for epoch in range(num_epochs):
        model.train()
        train_loss = 0
        for batch_idx, data in enumerate(train_loader):
            img,label = data
            img = img.view(img.size(0),-1).to(device)
            y_one_hot = torch.zeros(label.shape[0],10).scatter_(1,label.view(label.shape[0],1),1).to(device)
            optimizer.zero_grad()
            recon_batch, mean, lg_var = model(img, y_one_hot)
            loss = loss_function(recon_batch, img, mean, lg_var)
            loss.backward()
            train_loss += loss.data
            optimizer.step()
        if epoch % display_step == 0:
            print("Epoch:", '%04d' % (epoch + 1), "cost=", "{:.9f}".format(loss.data))
    print("完成训练 cost=",loss.data)


3.4 代码实战:训练模型并输出可视化结果----Variational_selfcoding.py(第4部分)


# 1.4 训练模型并输出可视化结果
if __name__ == '__main__':
    model = VAE().to(device) # 实例化模型
    train(model, 50)    # 训练模型
    test_loader = DataLoader(val_dataset, batch_size=len(val_dataset), shuffle=False) # 获取全部测试数据
    # 可视化结果
    sample = iter(test_loader)
    images, labels = sample.next()
    images2 = images.view(images.size(0), -1)
    with torch.no_grad():
        pred, mean, lg_var = model(images2.to(device))
    pred = to_img(pred.cpu().detach())
    rel = torch.cat([images, pred], axis=0)
    imshow(torchvision.utils.make_grid(rel, nrow=10))
    # 上一语句的生成结果中,第1行是原始的样本图片,第2行是使用变分自编码重建后生成的图片可以看到,生成的样本并不会与原始的输入样本完全一致。这表明模型不是一味地学习样本个体,而是通过数据分布的方式学习样本的分布规则。
    waitKey(30)


61292aba0d0c4eeca7eb0833e92d369e.png


3.5 代码实战:提取样本的低维数据并可视化----Variational_selfcoding.py(第5部分)

    # 1.5 提取样本的低维特征并可视化: 编写代码实现对原始数据的维度进行压缩,利用解码器输出的均值和方差从解码器输出的分布空间中取样,并将其映到直角坐标系中展现出来,具体代码如下。
    sample = iter(test_loader)
    images, labels = sample.next()
    with torch.no_grad(): # 将数据输入模型获得低维度特征:
        mean, lg_var = model.encode(images.view(images.size(0), -1).to(device))# 将数据输入模型获得低维度特征:
        z = model.reparametrize(mean, lg_var)# 将数据输入模型获得低维度特征:在输出样本空间中采样
    z =z.cpu().detach().numpy()
    plt.figure(figsize=(6, 6))
    plt.scatter(z[:, 0], z[:, 1], c=labels) # 在坐标轴中显示
    plt.colorbar()
    plt.show() 
    # 根据结果显示,数据集中同一类样本的特征分布还是比较集中的。这说明变分自编码神经网络具有降维功能,也可以用于进行分类任务的数据降维预处理。


566bdb2be2f94bf9879a61c87ab01e0b.png


3.6 代码实战:可视化模型的输出空间----Variational_selfcoding.py(第6部分)


#1.6 可视化模型的输出空间
    n = 15  # 生成15个图片
    digit_size = 28
    figure = np.zeros((digit_size * n, digit_size * n))
    # norm代表标准高斯分布,ppf代表累积分布函数的反函数。累积积分布的意思是,在一个集合里所有小于指定值出现的概率的和。举例,x=ppf(0.05)就代表每个小于x的数在集合里出现的概率的总和等于0.05。
    # norm.ppf()函数的作用是使用百分比从按照大小排列后的标准高斯分布中取值
    # p.linspace(0.05,0.95,n)的作用是将整个高斯分布数据集从大到小排列,并将其分成100份,再将第5份到第95份之间的数据取出、最后,将取出的数据分成n份,返回每一份最后一个数据的具体数值。
    grid_x = norm.ppf(np.linspace(0.05, 0.95, n))
    grid_y = norm.ppf(np.linspace(0.05, 0.95, n))
    for i, yi in enumerate(grid_x):
        for j, xi in enumerate(grid_y):
            z_sample = torch.FloatTensor([[xi, yi]]).reshape([1, 2]).to(device)
            x_decoded = model.decode(z_sample).cpu().detach().numpy()
            digit = x_decoded[0].reshape(digit_size, digit_size)
            figure[i * digit_size: (i + 1) * digit_size,
            j * digit_size: (j + 1) * digit_size] = digit
    plt.figure(figsize=(10, 10))
    plt.imshow(figure, cmap='Greys_r')
    plt.show()
    #从上一语句的生成结果中可以清楚地看到鞋子、手提包和服装商品之间的过渡。变分自编码神经网络生成的分布样本很有规律性,左下方侧重的图像较宽和较高,右上方侧重的图像较宽和较矮,左上方侧重的图像下方较宽、上方较窄,右下方侧重的图像较窄和较高。

12be0885be014b33b58078c00246a296.png


4 代码汇总(Variational_selfcoding.py)


import torch
import torchvision
from cv2 import waitKey
from torch import nn
import torch.nn.functional as F
from torch.utils.data import DataLoader
from torchvision import transforms
import numpy as np
from scipy.stats import norm # 在模型可视化时使用该库的norm接口从标准的高斯分布中获取数值
import matplotlib.pylab as plt
import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'  # 可能是由于是MacOS系统的原因
# 1.1 引入模块并载入样本:定义基础函数,并且加载FashionMNIST数据集
# 定义样本预处理接口
img_transform = transforms.Compose([transforms.ToTensor()])
def to_img(x): # 将张量转化为图片
    x = 0.5 * (x + 1)
    x = x.clamp(0,1)
    x = x.reshape(x.size(0),1,28,28)
    return x
def imshow(img): # 显示图片
    npimg = img.numpy()
    plt.axis('off')
    plt.imshow(np.transpose(npimg,(1,2,0)))
    plt.show()
data_dir = './fashion_mnist/' # 加载数据集
train_dataset = torchvision.datasets.FashionMNIST(data_dir,train=True,transform=img_transform,download=True)
# 获取训练数据集
train_loader = DataLoader(train_dataset,batch_size=128,shuffle=True)
# 获取测试数据集
val_dataset = torchvision.datasets.FashionMNIST(data_dir,train=False,transform=img_transform)
test_dataset = DataLoader(val_dataset,batch_size=10,shuffle=False)
# 指定设备
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("所使用的设备为:",device)
# 1.2 定义变分自编码神经网络模型的正向结构
class VAE(nn.Module):
    def __init__(self,hidden_1=256,hidden_2=256,in_decode_dim=2,hidden_3=256):
        super(VAE, self).__init__()
        self.fc1 = nn.Linear(784, hidden_1)
        self.fc21 = nn.Linear(hidden_2, 2)
        self.fc22 = nn.Linear(hidden_2, 2)
        self.fc3 = nn.Linear(in_decode_dim, hidden_3)
        self.fc4 = nn.Linear(hidden_3, 784)
    def encode(self,x): # 编码器方法:使用两层全连接网络将输入的图片进行压缩,对第二层中两个神经网络的输出结果代表均值(mean)与取对数(log)以后的方差(lg_var)。
        h1 = F.relu(self.fc1(x))
        return self.fc21(h1),self.fc22(h1)
    def reparametrize(self,mean,lg_var): # 采样器方法:对方差(lg_var)进行还原,并从高斯分布中采样,将采样数值映射到编码器输出的数据分布中。
        std = lg_var.exp().sqrt()
        # torch.FloatTensor(std.size())的作用是,生成一个与std形状一样的张量。然后,调用该张量的normal_()方法,系统会对该张量中的每个元素在标准高斯空间(均值为0、方差为1)中进行采样。
        eps = torch.FloatTensor(std.size()).normal_().to(device) # 随机张量方法normal_(),完成高斯空间的采样过程。
        return eps.mul(std).add_(mean)
    # 在torch.FloatTensor()
    # 函数中,传入Tensor的size类型,返回的是一个同样为size的张量。假如std的size为[batch,dim],则返回形状为[batch,dim]的未初始化张量,等同于torch.FloatTensor(
    #     batch,dim),但不等同于torchFloatTensor([batch,dim),这是值得注意的地方。
    def decode(self,z): # 解码器方法:输入映射后的采样值,用两层神经网络还原出原始图片。
        h3 = F.relu(self.fc3(z))
        return self.fc4(h3)
    def forward(self,x,*arg): # 正向传播方法:将编码器,采样器,解码器串联起来,根据输入的原始图片生成模拟图片
        mean,lg_var = self.encode(x)
        z = self.reparametrize(mean=mean,lg_var=lg_var)
        return self.decode(z),mean,lg_var
# 1.3 完成损失函数和训练函数
reconstruction_function = nn.MSELoss(size_average=False)
def loss_function(recon_x,x,mean,lg_var): # 损失函数:将MSE的损失缩小到一半,再与KL散度相加,目的在于使得输出的模拟样本可以有更灵活的变化空间。
    MSEloss = reconstruction_function(recon_x,x) # MSE损失
    KLD = -0.5 * torch.sum(1 + lg_var -  mean.pow(2) - lg_var.exp())
    return 0.5 * MSEloss + KLD
def train(model,num_epochs = 50): # 训练函数
    optimizer = torch.optim.Adam(model.parameters(),lr=1e-3)
    display_step = 5
    for epoch in range(num_epochs):
        model.train()
        train_loss = 0
        for batch_idx, data in enumerate(train_loader):
            img,label = data
            img = img.view(img.size(0),-1).to(device)
            y_one_hot = torch.zeros(label.shape[0],10).scatter_(1,label.view(label.shape[0],1),1).to(device)
            optimizer.zero_grad()
            recon_batch, mean, lg_var = model(img, y_one_hot)
            loss = loss_function(recon_batch, img, mean, lg_var)
            loss.backward()
            train_loss += loss.data
            optimizer.step()
        if epoch % display_step == 0:
            print("Epoch:", '%04d' % (epoch + 1), "cost=", "{:.9f}".format(loss.data))
    print("完成训练 cost=",loss.data)
# 1.4 训练模型并输出可视化结果
if __name__ == '__main__':
    model = VAE().to(device) # 实例化模型
    train(model, 50)    # 训练模型
    test_loader = DataLoader(val_dataset, batch_size=len(val_dataset), shuffle=False) # 获取全部测试数据
    # 可视化结果
    sample = iter(test_loader)
    images, labels = sample.next()
    images2 = images.view(images.size(0), -1)
    with torch.no_grad():
        pred, mean, lg_var = model(images2.to(device))
    pred = to_img(pred.cpu().detach())
    rel = torch.cat([images, pred], axis=0)
    imshow(torchvision.utils.make_grid(rel, nrow=10))
    # 上一语句的生成结果中,第1行是原始的样本图片,第2行是使用变分自编码重建后生成的图片可以看到,生成的样本并不会与原始的输入样本完全一致。这表明模型不是一味地学习样本个体,而是通过数据分布的方式学习样本的分布规则。
    waitKey(30)
    # 1.5 提取样本的低维特征并可视化: 编写代码实现对原始数据的维度进行压缩,利用解码器输出的均值和方差从解码器输出的分布空间中取样,并将其映到直角坐标系中展现出来,具体代码如下。
    sample = iter(test_loader)
    images, labels = sample.next()
    with torch.no_grad(): # 将数据输入模型获得低维度特征:
        mean, lg_var = model.encode(images.view(images.size(0), -1).to(device))# 将数据输入模型获得低维度特征:
        z = model.reparametrize(mean, lg_var)# 将数据输入模型获得低维度特征:在输出样本空间中采样
    z =z.cpu().detach().numpy()
    plt.figure(figsize=(6, 6))
    plt.scatter(z[:, 0], z[:, 1], c=labels) # 在坐标轴中显示
    plt.colorbar()
    plt.show()
    # 根据结果显示,数据集中同一类样本的特征分布还是比较集中的。这说明变分自编码神经网络具有降维功能,也可以用于进行分类任务的数据降维预处理。
#1.6 可视化模型的输出空间
    n = 15  # 生成15个图片
    digit_size = 28
    figure = np.zeros((digit_size * n, digit_size * n))
    # norm代表标准高斯分布,ppf代表累积分布函数的反函数。累积积分布的意思是,在一个集合里所有小于指定值出现的概率的和。举例,x=ppf(0.05)就代表每个小于x的数在集合里出现的概率的总和等于0.05。
    # norm.ppf()函数的作用是使用百分比从按照大小排列后的标准高斯分布中取值
    # p.linspace(0.05,0.95,n)的作用是将整个高斯分布数据集从大到小排列,并将其分成100份,再将第5份到第95份之间的数据取出、最后,将取出的数据分成n份,返回每一份最后一个数据的具体数值。
    grid_x = norm.ppf(np.linspace(0.05, 0.95, n))
    grid_y = norm.ppf(np.linspace(0.05, 0.95, n))
    for i, yi in enumerate(grid_x):
        for j, xi in enumerate(grid_y):
            z_sample = torch.FloatTensor([[xi, yi]]).reshape([1, 2]).to(device)
            x_decoded = model.decode(z_sample).cpu().detach().numpy()
            digit = x_decoded[0].reshape(digit_size, digit_size)
            figure[i * digit_size: (i + 1) * digit_size,
            j * digit_size: (j + 1) * digit_size] = digit
    plt.figure(figsize=(10, 10))
    plt.imshow(figure, cmap='Greys_r')
    plt.show()
    #从上一语句的生成结果中可以清楚地看到鞋子、手提包和服装商品之间的过渡。变分自编码神经网络生成的分布样本很有规律性,左下方侧重的图像较宽和较高,右上方侧重的图像较宽和较矮,左上方侧重的图像下方较宽、上方较窄,右下方侧重的图像较窄和较高。


相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
目录
相关文章
|
1月前
|
数据采集 存储 JSON
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理,以及存储爬取的数据。通过具体示例,帮助读者掌握Scrapy的核心功能和使用方法,提升数据采集效率。
94 6
|
13天前
|
存储 安全 网络安全
网络安全的盾与剑:漏洞防御与加密技术的实战应用
在数字化浪潮中,网络安全成为保护信息资产的重中之重。本文将深入探讨网络安全的两个关键领域——安全漏洞的防御策略和加密技术的应用,通过具体案例分析常见的安全威胁,并提供实用的防护措施。同时,我们将展示如何利用Python编程语言实现简单的加密算法,增强读者的安全意识和技术能力。文章旨在为非专业读者提供一扇了解网络安全复杂世界的窗口,以及为专业人士提供可立即投入使用的技术参考。
|
18天前
|
机器学习/深度学习 自然语言处理 数据可视化
【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现
阅读这个文章可能的收获:理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。
|
15天前
|
存储 缓存 监控
Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
本文介绍了Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
50 7
|
1月前
|
数据采集 前端开发 中间件
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第26天】Python是一种强大的编程语言,在数据抓取和网络爬虫领域应用广泛。Scrapy作为高效灵活的爬虫框架,为开发者提供了强大的工具集。本文通过实战案例,详细解析Scrapy框架的应用与技巧,并附上示例代码。文章介绍了Scrapy的基本概念、创建项目、编写简单爬虫、高级特性和技巧等内容。
65 4
|
1月前
|
网络协议 物联网 API
Python网络编程:Twisted框架的异步IO处理与实战
【10月更文挑战第26天】Python 是一门功能强大且易于学习的编程语言,Twisted 框架以其事件驱动和异步IO处理能力,在网络编程领域独树一帜。本文深入探讨 Twisted 的异步IO机制,并通过实战示例展示其强大功能。示例包括创建简单HTTP服务器,展示如何高效处理大量并发连接。
50 1
|
1月前
|
网络协议 安全 NoSQL
网络空间安全之一个WH的超前沿全栈技术深入学习之路(8-2):scapy 定制 ARP 协议 、使用 nmap 进行僵尸扫描-实战演练、就怕你学成黑客啦!
scapy 定制 ARP 协议 、使用 nmap 进行僵尸扫描-实战演练等具体操作详解步骤;精典图示举例说明、注意点及常见报错问题所对应的解决方法IKUN和I原们你这要是学不会我直接退出江湖;好吧!!!
网络空间安全之一个WH的超前沿全栈技术深入学习之路(8-2):scapy 定制 ARP 协议 、使用 nmap 进行僵尸扫描-实战演练、就怕你学成黑客啦!
|
1月前
|
网络协议 调度 开发者
Python网络编程:Twisted框架的异步IO处理与实战
【10月更文挑战第27天】本文介绍了Python网络编程中的Twisted框架,重点讲解了其异步IO处理机制。通过反应器模式,Twisted能够在单线程中高效处理多个网络连接。文章提供了两个实战示例:一个简单的Echo服务器和一个HTTP服务器,展示了Twisted的强大功能和灵活性。
43 0
|
2月前
|
算法 PyTorch 算法框架/工具
Pytorch学习笔记(九):Pytorch模型的FLOPs、模型参数量等信息输出(torchstat、thop、ptflops、torchsummary)
本文介绍了如何使用torchstat、thop、ptflops和torchsummary等工具来计算Pytorch模型的FLOPs、模型参数量等信息。
327 2
|
13天前
|
机器学习/深度学习 人工智能 PyTorch
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
本文探讨了Transformer模型中变长输入序列的优化策略,旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战,特别是填充方法导致的资源浪费。随后,提出了多种优化技术,包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式,显著提升了模型的性能。实验结果显示,使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒,相比未优化版本提升了约2.5倍。
33 3
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers

热门文章

最新文章