人工智能实践Tensorflow笔记:Tensorflow框架-3

简介: 人工智能实践Tensorflow笔记:Tensorflow框架-3

基于 Tensorflow 的 NN:

用张量表示数据,用计算图搭建神经网络,用会话执行计算图,优化线上的权重(参数),得到模型。


张量tensor:

张量就是多维数组(列表),用“阶”表示张量的维度。

0 阶张量称作 标量scalar

1 阶张量称作 向量vector []

2 阶张量称作 矩阵matrix [[]]


数据类型:

Tensorflow 的数据类型有 tf.float32、tf.int32 等。


计算图(Graph):

搭建神经网络的计算过程,是承载一个或多个计算节点的一张图,只搭建网络,不运算。

image.png

会话(Session):

执行计算图中的节点运算。


神经网络的参数:

是指神经元线上的权重 w


神经网络中常用的生成随机数/数组的函数

image.png


image.png

神经网络的实现过程:

1、准备数据集,提取特征,作为输入喂给神经网络(Neural Network,NN)

2、搭建 NN 结构,从输入到输出(先搭建计算图,再用会话执行)

( NN 前向传播算法 计算输出)

3、大量特征数据喂给 NN,迭代优化 NN 参数

( NN 反向传播算法 优化参数训练模型)

4、使用训练好的模型预测和分类


训练过程和使用过程


前向传播:

就是搭建模型的计算过程,让模型具有推理能力,可以针对一组输入给出相应的输出。

image.png

待优化的参数:

W 前节点编号,后节点编号(层数)


神经网络共有几层(或当前是第几层网络)都是指的计算层,输入不是计算层


反向传播:

训练模型参数,在所有参数上用梯度下降,使 NN 模型在训练数据上的损失函数最小。

image.png

损失函数(loss):

计算得到的预测值 y 与已知答案 y_的差距。


均方误差 MSE:

求前向传播计算结果与已知答案之差的平方再求平均。

loss_mse = tf.reduce_mean(tf.square(y_ - y))

image.png

反向传播训练方法:

以减小 loss 值为优化目标,有梯度下降、momentum 优化器、adam 优化器等优化方法。

随机梯度下降算法

train_step=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

超参数

train_step=tf.train.MomentumOptimizer(learning_rate, momentum).minimize(loss)

自适应学习率的优化算法

train_step=tf.train.AdamOptimizer(learning_rate).minimize(loss)


学习率:决定每次参数更新的幅度。

进阶:反向传播参数更新推导过程


搭建神经网络的八股

准备工作

前向传播

反向传播

循环迭代


linux:

vim ~/.vimrc 写入:

set ts=4 表示使 Tab 键等效为 4 个空格

set nu 表示使 vim 显示行号 nu 是 number 缩写


“提示 warning”,是因为有的电脑可以支持加速指令,

但是运行代码时并没有启动这些指令。

“提示 warning”暂时屏蔽掉。主目录下的 bashrc 文件,

加入这样一句 export TF_CPP_MIN_LOG_LEVEL=2,把“提示warning”等级降低


“0”(显示所有信息)

“1”(不显示 info),

“2”代表不显示 warning,

“3”代表不显示 error。一般不建议设置成 3


source 命令用于重新执行修改的初始化文件

使之立即生效,而不必注销并重新登录。


代码示例

随机产生 32 组生产出的零件的体积和重量,训练 3000 轮,每 500 轮输出一次损

失函数。下面我们通过源代码进一步理解神经网络的实现过程:

# -*- coding: utf-8 -*-
# @File    : 搭建神经网络八股.py
# @Date    : 2018-06-02
# 搭建神经网络的八股
# 准备工作 -> 前向传播 -> 反向传播 -> 循环迭代
# 1、导入模块,生成模拟数据集;
import tensorflow as tf
import numpy as np
BACH_SIZE = 8
SEED = 23455
# 基于随机数产生 32行2列的随机数
rng = np.random.RandomState(SEED)
X = rng.rand(32, 2)  #  随机数组, 浮点数,[0, 1)均匀分布
# 输入数据集的标签(正确答案)x0+x1<1 -> 1   x0+x1>=1 -> 0
Y = [[int(x0 + x1 < 1)] for (x0, x1) in X]
print("X: \n%s"%X)
print("Y: \n%s"%Y)
# 2、定义神经网络的输入、参数和输出,定义前向传播过程;
x = tf.placeholder(tf.float32, shape=(None, 2))
y_ = tf.placeholder(tf.float32, shape=(None, 1))
# 生成正态分布随机数,形状两行三列,标准差是 1,随机种子是 1
w1 = tf.Variable(tf.random_normal(shape=[2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal(shape=[3, 1], stddev=1, seed=1))
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
# 3、定义损失函数及反向传播方法
# 均方误差
loss = tf.reduce_mean(tf.square(y - y_))
# 随机梯度下降算法,使参数沿着梯度的反方向,即总损失减小的方向移动,实现更新参数。
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(loss)
# 4、生成会话,训练 STEPS 轮
with tf.Session() as session:
    init_option = tf.global_variables_initializer()
    session.run(init_option)
    # 输出未经训练的参数值
    print("w1: \n", session.run(w1))
    print("w2 \n", session.run(w2))
    print("\n")
    # 训练模型
    STEPS = 3000
    for i in range(STEPS):
        start = (i*BACH_SIZE)%32
        end = start + BACH_SIZE
        session.run(train_step, feed_dict={x: X[start: end], y_: Y[start: end]})
        if i %500 == 0:
            total_loss = session.run(loss, feed_dict={x: X, y_:Y})
            print("ssetp %d, loss %s"% (i, total_loss))
    # 训练后的取值
    print("w1\n", session.run(w1))
    print("w2\n", session.run(w2))
"""
    由神经网络的实现结果,我们可以看出,总共训练 3000 轮,每轮从 X 的数据集
和 Y 的标签中抽取相对应的从 start 开始到 end 结束个特征值和标签,喂入神经
网络,用 sess.run 求出 loss,每 500 轮打印一次 loss 值。经过 3000 轮后,我
们打印出最终训练好的参数 w1、w2。
"""

相关文章
|
8天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
125 55
|
17天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
104 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
DiffSensei 是一个由北京大学、上海AI实验室及南洋理工大学共同推出的AI漫画生成框架,能够生成可控的黑白漫画面板。该框架整合了基于扩散的图像生成器和多模态大型语言模型(MLLM),支持多角色控制和精确布局控制,适用于漫画创作、个性化内容生成等多个领域。
70 18
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
|
5天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
42 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
10天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
96 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
11天前
|
人工智能 安全 PyTorch
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
SPDL是Meta AI推出的开源高性能AI模型数据加载解决方案,基于多线程技术和异步事件循环,提供高吞吐量、低资源占用的数据加载功能,支持分布式系统和主流AI框架PyTorch。
46 10
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
|
11天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
74 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
13天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
56 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
16天前
|
机器学习/深度学习 人工智能 算法
【AI系统】AI 框架基础介绍
本文介绍了AI算法、神经网络及其应用,解释了为何神经网络需要训练及AI框架的作用。通过解析深度学习的数学原理与反向求导算法,阐述了AI框架如何作为模型设计、训练和验证的标准工具,支持算法封装、数据调用及计算资源管理,强调了AI框架的发展历程和技术迭代。
48 9
【AI系统】AI 框架基础介绍
|
15天前
|
机器学习/深度学习 人工智能 算法
【AI系统】框架编程范式
编程范式是软件工程中一类典型的编程风格,如函数式、命令式、声明式、面向对象等。它们影响着开发者对程序执行的理解。本文探讨了两种主要的编程范式——声明式编程与命令式编程,特别是在AI框架中的应用,如TensorFlow的声明式编程和PyTorch的命令式编程,分析了这两种范式对AI框架架构设计的影响及主流AI框架在这两种范式上的差异。
46 3
【AI系统】框架编程范式