TensorFlow 2.0 教程 01:基本图形分类

2019-11-02 08:55:00 Python部落

TensorFlow 2 现在已经上线了!

TensorFlow 2现在是实时的!本教程将指导您使用深度学习构建一个简单的CIFAR-10图像分类器。在本教程中，我们将:

定义一个模型
设置一个数据管道
训练模型
使用多GPU加速训练速度
为监控过程/更新学习计划添加回调。

本教程中的代码可以在这里找到。（地址：https://github.com/lambdal/TensorFlow2-tutorial/tree/master/01-basic-image-classification ）

定义模型

TensorFlow 2使用Keras作为其高级API。Keras提供了两种定义模型的方法:顺序式API和函数式API。

使用Keras的顺序式API定义一个模型

使用Keras的函数式API定义相同的模型

顺序式API与函数式API

这些API之间的主要区别是：顺序式API要求其第一层使用input_shape提供，而函数式API要求其第一层是tf.keras.layers.Input，并且需要在最后调用tf.keras.models.Model构造器。

顺序式API更简洁，而函数式API更灵活，因为它允许一个模型是非顺序式的。例如，要在ResNet中具有跳过连接。本教程采用TensorFlow官方的ResNet的Keras实现，它使用了函数式API。

设置一个数据管道

我们现在已经定义了一个模型。为了训练这个模型，我们需要一个数据管道来向它提供标签化的训练数据。该数据管道执行以下任务:

加载: 将数据集（例如图像和标签）从存储器复制到程序的内存中。
预处理:转换数据集。例如，在图像分类中，我们可能会调整大小、白化、洗牌或批处理图像。
供给数据: 从一个数据集中获取例子并传入到一个训练循环中。

从存储器加载数据

首先，我们将CIFAR-10从存储器加载到numpy ndarrays:

注意:

当您第一次调用keras.datasets.cifar10.load_data时，CIFAR-10将会被从网络下载到 ~/.keras/datasets/cifar-10-batches-py.tar.gz。后续的调用就不涉及到网络了。
x 表示尺寸为32 x 32 x 3的50000个图像 (宽度、高度和三个RGB通道)。
y表示这50000个图像的标签。

理论上来说，我们可以简单地将这些原始numpy.ndarray对象提供到一个训练循环中，并将这称为一个数据管道。然而，为了获得更高的模型精度，我们需要对数据进行预处理(即在使用之前对其执行某些转换)。为此，我们利用了Tensorflow的Dataset类。

tf.data.Dataset 类

TensorFlow的Dataset类有两个主要用途:

它充当一个保存训练数据的容器。
它可以被用来在训练数据的元素上执行某些变换。

我们按照以下方式来实例化一个表示CIFAR-10数据集的tensorflow.data.Dataset对象:

在训练过程中，存储在train_dataset中的CIFAR-10训练示例将通过take()迭代器进行访问:

实际上，我们没有执行任何数据预处理过程。调用take()只简单地发送出原始CIFAR-10图像;前20张图像如下:

数据扩充

扩充经常用于“膨胀”训练数据集，这可以提高泛化性能。

让我们通过对每个图像执行以下步骤来扩充CIFAR-10数据集:

使用一个四像素的黑色边框填充图像。
从填充图像中随机裁剪一个32x32的区域。
抛硬币来决定图像是否应该被水平翻转。

我们首先定义一个函数，给定一个图像，执行上面的步骤1-3:

接下来，我们调用方法map;这个调用会返回一个新的Dataset对象，该对象包含将CIFAR-10中的每个图像传递到 augmentation中的结果。这个新对象将以原始顺序来发送转换后的图像:

以下是扩充后的前20张图像:

注: 扩充只应用于训练集;在推理过程中应用扩充将导致不确定的预测和验证分数。

随机打乱

我们随机打乱数据集。TensorFlow Dataset有一个shuffle方法，可以按照以下方式来将它链接到我们的扩充过程中:

要获得完美的随机打乱效果，buffer_size应该大于或等于数据集的大小(在本例中为50,000);对于大型数据集，这是不可能的。

以下是随机打乱后的Dataset中的20张图像:

规范化

将数据规范化是一种常见的做法。在这里，我们定义一个函数，线性缩放每个图像使具有零均值和单位方差:

接下来，我们将它与我们的扩充和随机打乱操作链接起来:

数据batching

最后，我们对数据集进行batch操作。我们将drop_remainder设置为True以删除足够多的训练示例，以便训练集的大小可以被batch_size整除。

我们现在有了一个完整的数据管道。现在我们就可以开始训练过程了。

训练模型

Keras模型需要在训练之前进行编译。编译过程本质上定义了三个东西:损失函数、优化器和评估指标:

注意，这里我们使用了sparse_categorical_crossentropy和 sparse_categorical_accuracy，因为每个标签都由一个整数(类的索引)表示。如果一个独热编码向量表示每个标签，那么我们应该使用categorical_crossentropy 和 categorical_accuracy。

Keras使用fit API来训练模型。我们可以选择在每个validation_freq训练epoch（迭代）中在一个验证数据集上来测试模型。

注意，我们使用测试数据集只是为了进行验证，因为CIFAR-10本身并不提供验证集。模型合理性验证应该在从训练数据集中分割出来的一组数据上进行。

注意，在本例中，fit函数接受了TensorFlow数据集对象(train_dataset和 test_dataset)。如前所述，它还可以接受numpy的ndarrays作为输入。使用数组的缺点是缺乏在数据集应用转换的灵活性。

要对模型进行评估，我们可以使用测试数据集调用evaluate方法:

多GPU

到目前为止，我们已经展示了如何使用TensorFlow的Dataset API来创建一个数据管道，以及如何使用Keras API来定义模型并进行训练和评估。下一步是让代码使用多个GPU来运行。

实际上，Tensorflow 2已经使您可以很容易地将您的单GPU实现转换成使用多个GPU运行。您所需要做的就是定义一个分布策略，并在策略范围内创建模型:

我们这里使用的是MirroredStrategy，它支持在一台机器上的多个GPU上执行同步的分布式训练。默认情况下，它使用NVIDIA NCCL作为多gpu归约实现。

注意，您将会想要基于您正在使用的GPU数量来使用数据管道的batch方法来扩展批尺寸。

添加回调

通常我们需要在训练期间执行一些自定义操作。例如，您可能希望在训练期间记录统计信息以用于调试或优化;执行一个学习速率时间表来提高训练效率;或者保存筛选器组聚集时的可视快照。在TensorFlow 2中，您可以使用回调特性来在训练期间实现自定义事件。

Tensorboard

TensorBoard主要用于在训练过程中记录和可视化信息。它非常适合于检查模型的性能。Tensorboard支持是通过tensorflow.keras.callbacks.TensorBoard回调函数提供的：

在上面的例子中，我们首先创建了一个TensorBoard回调，用于记录每个训练步骤的数据(通过update_freq=batch)，然后将这个回调附加到fit函数。TensorFlow将会生成tfevents文件，可以使用TensorBoard将其可视化。例如，这是训练过程中分类精度的可视化(蓝色表示训练精度，红色表示验证精度):

学习速率时间表

通常，我们希望随着训练的进行能对学习速率有良好的控制。一个自定义学习速率时间表可以作为回调函数来实现。在这里，我们创建了一个自定义的schedule函数，它使用一个step函数(在第30个epoch和第45个epoch)来降低学习速率。这个schedule被转换成一个keras.callbacks.LearningRateScheduler并附加到fit函数。

这些是一个60个epoch的自定义学习速率的统计信息:

总结

本教程以图像分类为例，介绍了TensorFlow 2.0的基础知识。我们覆盖了:

带有TensorFlow 2的数据集API的数据管道
使用Keras (TensorFlow 2的官方高级API)训练、评估、保存和恢复模型
带有分布式策略的多GPU
带有回调的自定义训练

下面是本教程的完整代码。您还可以使用此TensorFlow 2.0教程代码仓库来复制我们有关TensorFlow 2.0的教程。

英文原文：https://lambdalabs.com/blog/tensorflow-2-0-tutorial-01-image-classification-basics/

分享到:

閱讀更多 Python部落 的文章

關鍵字: 分类 BASIC语言图形

教程：为数据科学构建自己的大数据基础架构

【教程】无需代码小白也能建个人网站

由资深程序员整理的最全Java干货+教程，要的赶紧拿走

Python任务自动化工具 tox 教程

教程：腾讯云使用WordPress从零开始建站-黑科鸡Blog（六）

Navicat 连接MYSQL8 教程

外网IP访问畅捷通T+教程

教程：用golang从零开始手写一个bt下载客户端（7）

微软最新推荐的400集Python 教程，居然用7个章节将Python讲明白

03.02 Python MongoDB 教程

教程：用golang从零开始手写一个bt下载客户端（6）

教程：用golang从零开始手写一个bt下载客户端（5）

教程：用golang从零开始手写一个bt下载客户端（4）

03.02 教程：用golang从零开始手写一个bt下载客户端

02.28 Python 教程

Python 3 教程

「教程」Windows下php安装redis扩展

学习Shell 教程

最系统最详细的Python 教程：从小白到大师

全网最系统且全面的JVM知识点总结，附赠Java328集视频教程

10.22 Axure 教程：原型中埋点统计验证需求

全网顶尖、最系统的JVM知识点总结，附赠Java300集视频教程

全网顶级、最系统的JVM知识点总结，附赠Java300集视频教程

干货｜MySQL配置优化32个技巧详解，附面试题+教程

Axure 教程：web网站原型设计技巧的分享

Python3 教程-- 3、解释器

Python3 教程-- 2、基本数据类型

【教程】TestComplete测试桌面应用程序教程（六）

pychram下部署Django博客【变饼档】教程

Android Studio 安装教程

SQL 教程：如何编写更佳的查询

大小仅17KB！这个微型风格迁移模型太好玩了｜代码+教程

HTML 教程-(HTML5 标准）

Python 教程：从零到大师！我不相信你学不会！

史上最简单的 MyBatis 教程

「小白学Python教程」最简单，最容易理解的Django 教程

Webpack4 教程：入口、输入和ES6模块（第一章）

教程：采用梯度下降算法实现线性回归！

教程、学习和网址

教程：Python量子计算入门

「教程」IOS10.2越狱后CYDIA闪退的解决方案（搬运）

「教程」终于有人把Java内存模型说清楚了！

全网最简明的PyQt 5 教程，神级Python现场开发一个专属浏览器！

06.22 教程：如何使用迁移学习分类坑洼图像

教程：如何使用迁移学习分类坑洼图像

06.08 教程：用强化学习玩转恐龙跳跳

「教程」如何进入内网

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"