一、各种函数
strip():
方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。
split() :
通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串。
pprint:
相比于print,pprint打印出来的更加好看,结构清晰,适合打印多条语句的时候使用
ImageDataGenerator:
1、数据增强函数:从现有的训练样本中生成更多的训练数据。其方法是利用多种能够生成可信图像的随机变换来增加样本。 2、可以快速创建python生成器,能够将硬盘上的图像文件自动转换为预处理好的张量批量。 3、目标:模型在训练时不会两次查看完全相同的图像,这让模型能够观察到数据的更多内容。
fit_generator:
Keras在使用.fit_generator训练模型时的过程: 1、Keras调用提供给.fit_generator的生成器函数(在本例中为aug.flow) 2、生成器函数为.fit_generator函数生成一批大小为BS的数据 3、.fit_generator函数接受批量数据,执行反向传播,并更新模型中的权重重复该过程直到达到期望的epoch数量
为什么fit_generator函数中有steps_per_epoch参数?
1、Keras数据生成器意味着无限循环,它永远不会返回或退出。由于该函数旨在无限循环,因此Keras无法确定一个epoch何时开始的,并且新的epoch何时开始。
2、因此,我们将训练数据的总数除以批量大小的结果作为steps_per_epoch的值。一旦Keras到达这一步,它就会知道这是一个新的epoch。
二、使用步骤
1.引入库
代码如下(示例):
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings('ignore') import ssl ssl._create_default_https_context = ssl._create_unverified_context
2.读入数据
代码如下(示例):
data = pd.read_csv( 'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv') print(data.head())
该处使用的url网络请求的数据。