【深度学习】今日bug(8月2)

简介: 【深度学习】今日bug(8月2)

一. TypeError: ‘method’ object is not iterable


1. 错误提示 && 部分代码


错误提示:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-40-9ae7d7a05a23> in <module>
      4 # 从数值标签到文本标签
      5 true_labels = d2l.get_fashion_mnist_labels(y.asnumpy())
----> 6 pred_labels = d2l.get_fashion_mnist_labels(net(X).argmax(axis=1).asnumpy)
      7 titles = [true + '\n' + pred for true, pred in zip(true_labels, pred_labels)]
      8 
D:\anaconda\lib\site-packages\d2lzh\utils.py in get_fashion_mnist_labels(labels)
    183     text_labels = ['t-shirt', 'trouser', 'pullover', 'dress', 'coat',
    184                    'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot']
--> 185     return [text_labels[int(i)] for i in labels]
    186 
    187 
TypeError: 'method' object is not iterable

通常错误提示还是非常有用的,可以有效地帮助我们地定位bug的位置。


部分代码段:


for X, y in test_iter:
    break
# 从数值标签到文本标签
true_labels = d2l.get_fashion_mnist_labels(y.asnumpy())
pred_labels = d2l.get_fashion_mnist_labels(net(X).argmax(axis=1).asnumpy)
titles = [true + '\n' + pred for true, pred in zip(true_labels, pred_labels)]
d2l.show_fashion_mnist(X[0:9], titles[0:9])

2. 消灭bug

我看着这个报错,当时就懵了,没看懂它啥意思。后来仔细检查代码发现,原来是调用一个函数asnumpy时,函数名后面的()掉了。于是原本我想调用的函数,被认作了一个对象,作为参数传递给了另一个函数,然后进一步引发了类型错误(TypeError)。


加上缺失的()后,一切正常。程序跑起来了:


image.png


二. 自动求梯度,求函数值了吗?


代码:


num_epochs = 3
lr = 0.1
# 用于训练模型
def train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, params=None, lr=None, trainer=None):
    for epoch in range(num_epochs):
        train_l_sum, train_acc_sum, n = 0.0, 0.0, 0
        for X, y in train_iter:
            with autograd.record():
                y_hat = net(X)
                l = loss(y_hat, y).sum()
            l.backward()
            d2l.sgd(params, lr, batch_size)
            y = y.astype('float32')
            train_l_sum += l.asscalar()
            train_acc_sum += (y_hat.argmax(axis=1) == y).sum().asscalar()
            n += y.size
        test_acc = evaluate_accuracy(test_iter, net)
        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f' % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))

我对于这段代码一直有些困惑,主要在train_l_sum += l.asscalar()这一语句。这里使用了变量l的值,用于计算模型在训练集上的损失。但是l的值是哪里来的?


我们看下面这段代码:


%matplotlib inline
import d2lzh as d2l
from mxnet import gluon, autograd, nd
X = nd.array([2, 3, 4])
X.attach_grad()
with autograd.record():
    y = X ** 2
# y.backward()
y, X.grad

输出:

image.png


原来在使用mxnet的自动求梯度的过程中,在y = X ** 2这一步,也就已经求出了y的值。它不仅仅是表示要求导的一个函数表达式,同时也是一个赋值语句。


小结


在一些小错误费上很多时间,真的划不来。

下次不要再这么马虎了啊。


经常有一些问题,想明白了之后,只感觉之前自己好傻。


相关文章
|
8月前
|
机器学习/深度学习 数据采集 图形学
基于深度学习的面片修复
面片修复(Mesh Repair)是计算机图形学和计算机视觉中的重要任务,旨在修复三维网格(mesh)中的缺陷,如孔洞、裂缝和噪声。基于深度学习的方法在面片修复中展现了强大的能力,通过学习数据中的几何特征,能够自动、高效地完成修复工作。
76 1
|
机器学习/深度学习 人工智能 异构计算
“寻根问祖”深度学习只需六段代码
想要入门深度学习,不知道其历史怎么可以?本文就通过程序员通用语言——代码来介绍深度学习的发展历史。
2309 0
|
9月前
|
机器学习/深度学习 算法 数据可视化
深度学习代码通常包括以下几个主要部分
【5月更文挑战第11天】深度学习代码通常包括以下几个主要部分
57 1
|
机器学习/深度学习 新零售 数据采集
|
机器学习/深度学习 自然语言处理 大数据
手把手教你数据不足时如何做深度学习NLP
还在发愁没有数据做深度学习,看看别人如何实现的把!
2756 0
|
4月前
|
机器学习/深度学习 缓存 算法
深度学习之代码优化
基于深度学习的代码优化是一种使用深度学习技术来提升编程代码性能、减少运行时间或资源消耗的方式。通过模型学习大量代码的特征和结构,深度学习可以帮助自动化地识别和应用优化策略。
68 4
|
机器学习/深度学习 人工智能 自然语言处理
深度学习教程 | 深度学习的实用层面
本篇讲解如何优化神经网络模型,包括Train / Dev / Test sets的切分和比例选择,Bias和Variance的相关知识,防止过拟合的方法,规范化输入以加快梯度下降速度和精度,梯度消失和梯度爆炸的原因及处理方法,梯度检查。
192 1
深度学习教程 | 深度学习的实用层面
|
机器学习/深度学习 传感器 人工智能
谈谈深度学习的4个问题|
人工智能(AI)是数字时代的一项变革性技术,其在整个经济中的实际应用正在迅速增长。
谈谈深度学习的4个问题|
|
机器学习/深度学习 人工智能 自然语言处理

热门文章

最新文章