从零开始学TensorFlow-阿里云开发者社区

前言

只有光头才能变强。

文本已收录至我的GitHub仓库，欢迎Star：https://github.com/ZhongFuCheng3y/3y

TensorFlow logo

最近在学习TensorFlow的相关知识，了解了TensorFlow一些基础的知识，现在周末有空了，就写写一些笔记，记录一下自己的成长~

总的来说，TensorFlow还是一个比较新的技术，有兴趣的同学不妨跟着我的笔记，一起学学呗(反正没坏处)~

知识背景：没有Python基础，没有机器学习基础，可以说是真正从零学TensorFlow的了。

一、安装Tensorflow所需要的环境

1.1安装Python环境

使用环境：Mac

Python有好多个版本，在Mac中自带的Python版本是2.7，但相对而言比较老了。现在一般用Python3.x了，本次下载的版本是3.5.6

我安装Python所使用方法的大致步骤：

安装Homebrew
安装pyenv
在.bash_profile添加环境变量
让环境变量生效
安装3.X版本python

详情可参考如下的链接(总的来说，我根据下面的教程一下子就安装了我想要的Python版本，还是非常不错的。)：

Mac下安装多版本python：
- https://www.cnblogs.com/webgiser/p/7463974.html
pyenv相关的命令(常用的pyenv命令):
- https://www.jianshu.com/p/af1f8d7b6b31

在安装Python的时候也发现了一个小知识点：

Mac一般使用bash作为默认的shell，会有好几个环境变量，其中etc/profile是系统级的，还有几个用户级别的环境变量，比如说：~/.bash_profile
如果修改的是系统级别的环境变量，也就是etc/profile，在保存的时候只能是:wq!覆盖，不然会出现readonly错误

(至于TensorFlow和numpy依赖的下载，这里我就不说了，就两条命令就搞掂啦)

1.2PyCharm编辑器

Java有IDEA神器，同样的，Python也有PyCharm，同样是JetBrains出产的。

我在之前从来没使用过PyCharm，也没写过一句的Python代码。

把Pycharm安装好了之后，我想当然就new project去用了，然后就next,next,next，当成IDEA来用。但发现了一个问题：我在之前明明装好了TensorFlow和numpy的依赖，在PyCharm环境下却识别不出来！在命令行窗口下，依赖是存在的！

后来才发现：如果用PyCharm去new一个project，会默认建一个解析器在当前的项目目录下。而PyCharm会遵守“就近原则”使用当前项目路径下的解析器。而我们添加的依赖(TensorFlow、numpy)是在我们安装Python的路径下的，这就导致了在命令行下找到依赖，而在PyCharm中找不到依赖。

解决也很简单：在PyCharm指定一下我们安装Python的路径，切换一下就好了。

参考资料：

关于pip安装第三方库，但pycharm中却无法识别的问题；以及pycharm安装第三方库的方法解析
- https://blog.csdn.net/weixin_41287260/article/details/83957731

二、体验TensorFlow

好的，我们现在已经安装好TensorFlow所需要的环境了！(看起来好简单，但还是花了我不少时间....)

首先我们来看一下这个例子可以干些什么：我们有非常多张的图片(数据集)，这些图片有不同的类型(比如衣服、鞋子、裤子，一共有10种类型)，把这些数据集扔进我们的神经网络里头，生成出模型。有了模型以后，当我们再将类似的图片扔进去，这个模型可以帮我们预测这张图片是衣服还是鞋子还是裤子。

数据集

随后，我跟着官网的代码跑了一(代码我都只是一步一步复制粘贴)，最后跑起来：

# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np

print(tf.__version__)

# 加载数据、区分出测试数据和训练数据
# 注意：如果已经下过，重复下载的话，可能会出现EOFError: Compressed file ended before the end-of-stream marker was reached错误

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# 分类的列表
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

# 查看数据的值
print(train_images.shape)  # 样本的shape(可以看出有多少条样本、维度)
print(len(train_labels))  # label的个数，有多少个样本，就应该有多少个label
print(train_labels)  # label的值，对应上面分类列表(从0到9)


# 对测试数据和训练数据进行预处理(实际上就是归一化)
train_images = train_images / 255.0
test_images = test_images / 255.0

# 设置层  (初始处理)--- 建立神经层
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(10, activation=tf.nn.softmax)
])


# 损失函数、优化器、指标
model.compile(optimizer=tf.train.AdamOptimizer(),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 将训练集丢进去，训练出模型(Model)
model.fit(train_images, train_labels, epochs=5)

# 将测试数据丢到模型中，评估一下得分(准确率)
test_loss, test_acc = model.evaluate(test_images, test_labels)
print('Test accuracy:', test_acc)

# 评估完准确率以后，我们可以对测试数据进行预测
predictions = model.predict(test_images)

# 选第一个样本预测后的得出最有可能结果
print(np.argmax(predictions[0]))

# 对比结果
print(test_labels[0])

跑出来的结果：

(后期注释：这是TensorFlow的版本)

1.12.0

(后期注释：这是TensorFlow下载数据集的日志)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 3us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz

26427392/26421880 [==============================] - 12s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz

4423680/4422102 [==============================] - 2s 0us/step

(后期注释：样本的shape)

(60000, 28, 28)

(后期注释：样本有多少条，对应的label就有多少条)

60000

(后期注释：label的值是从0-9，表示有九种类别)

[9 0 0 ... 3 0 5]

(后期注释：开始训练)

Epoch 1/5
2019-02-19 14:00:46.842852: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA

60000/60000 [==============================] - 4s 65us/step - loss: 0.4995 - acc: 0.8246
Epoch 2/5
60000/60000 [==============================] - 4s 62us/step - loss: 0.3734 - acc: 0.8655
Epoch 3/5
60000/60000 [==============================] - 4s 63us/step - loss: 0.3346 - acc: 0.8788
Epoch 4/5
60000/60000 [==============================] - 4s 63us/step - loss: 0.3102 - acc: 0.8861
Epoch 5/5
60000/60000 [==============================] - 4s 63us/step - loss: 0.2918 - acc: 0.8916

10000/10000 [==============================] - 0s 36us/step

(后期注释：预测出来的精确度)

Test accuracy: 0.8514

(后期注释：选第一个样本进行预测，并对比实际的结果)

9
9

参考资料：

Tensorflow学习笔记之一：训练你的第一个神经网络——基础分类
- https://www.jianshu.com/p/d4fb3a391d22

2.1总结一下使用TensorFlow的步骤

加载数据：使用dataset的api加载数据，并将数据集分成训练数据和测试数据
检查数据：检查dataSet的数据有没有问题(例如，样本的记录数、label的记录数等)
对数据预处理：对测试数据和训练数据进行归一化处理，目的：减少因为数值的大小所带来的影响(一般我们会将值都缩小在一个小的范围内)
建立神经网络：(输入层、隐藏层、输出层)
为模型定义损失函数、优化器、指标
将训练数据丢进我们的神经网络中，生成出Model
将测试数据丢进我们生成好的Model进行评估，预测出我们的准确率

三、TensorFlow介绍

3.1什么是TensorFlow

如果去Google搜关键字“TensorFlow”，那可能你会看到这么一句话：

An open source machine learning framework for everyone.

没错，TensorFlow就是一个机器学习的框架。至于框架，相信大家也比较好理解了；类比到Java，比如说我们的Spring框架给我们封装了好多好用的API，简化我们的开发(想想当年写Servlet的时候！)

TensorFlow作为机器学习的框架，同样也给我们封装了好多好用的API，能够降低学习机器学习的门槛。

就拿上面的例子来说，没想到那么少的代码就可以跑机器学习的“HelloWorld”了！

3.2TensorFlow的架构

我们可以发现上面的Demo所用的基础语言是Python，但不要认为TensorFlow就是Python的一个框架。我看到过一个比喻，觉得写得挺好的，粘贴一下：

Python 和 Tensorflow 之间的联系，可以类比 Javascript 和 HTML 之间的关系。Javascript 是一种全功能的编程语言，可以实现各种出色的效果。HTML 是用于表示某种类型的实用计算抽象（这里指的是可由 Web 浏览器呈现的内容）的框架。Javascript 在交互式网页中的作用是组装浏览器看到的 HTML 对象，然后在需要时通过将其更新为新的 HTML 来与其交互。

作者：AI前线
链接：https://juejin.im/post/5b345a49f265da599c561b25

下面再来看看TensorFlow的架构图(Python只是对TensorFlow进行了封装)

Python封装了TensorFlow引擎

TensorFlow的引擎也是分了很多模块的(这里我们简单了解一下)：

TensorFlow架构

最后

总结一下这篇文章：

安装TensorFlow必要的环境
跟着官方文档，体验一下TensorFlow(机器学习)的“HelloWorld”
- 根据给出的例子，猜出使用TensorFlow(机器学习)时需要做哪些步骤
TensorFlow就是一个机器学习(深度学习)的框架，提供了很多实用的API方便我们去玩机器学习(深度学习)。

相信看到这里，很多人都跟我之前一样，一脸懵逼。对官方给出的例子中的API不熟悉，去查阅相关资料的时候又发现有好多机器学习相关的术语，对这些术语又不了解。然后就循环懵逼..


while(true){
    // 循环懵逼..
}

其实回想刚学Java的时候，也是这么一个过程，当你从屏幕看到“HelloWorld”了以后，大概率来说也是不了解相关的API具体做了什么事(甚至连API都不知道是啥意思)。但花一段时间去学习了以后，就会发现，原来HelloWorld是真的简单！


public static void main(String[] args) {

    System.out.println("Hello World");

}

后续我会继续更新我学习TensorFlow时的一些笔记，有兴趣的小伙伴不妨跟着我一起学习~

另外，从文章的开头我也已经说了，我对Python、机器学习都是没有相关基础的，如果有写错的地方不妨在评论区留言指正。

下一篇预告：TensorFlow是什么意思？Tensor？Flow？介绍TensorFlow一些最基础的知识以及常见的机器学习术语。

乐于输出干货的Java技术号：Java3y。号内有200多篇原创技术文章、海量视频资源、精美脑图，不妨来关注一下！

觉得我的文章写得不错，不妨点一下赞！

从零开始学TensorFlow

前言

一、安装Tensorflow所需要的环境

1.1安装Python环境

1.2PyCharm编辑器

二、体验TensorFlow

2.1总结一下使用TensorFlow的步骤

三、TensorFlow介绍

3.1什么是TensorFlow

3.2TensorFlow的架构

最后

Java技术进阶

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

从零开始学TensorFlow

前言

一、安装Tensorflow所需要的环境

1.1安装Python环境

1.2PyCharm编辑器

二、体验TensorFlow

2.1总结一下使用TensorFlow的步骤

三、TensorFlow介绍

3.1什么是TensorFlow

3.2TensorFlow的架构

最后

Java技术进阶

热门文章

最新文章

相关课程

相关电子书