手把手教你用一个简单的2DCNN完成MNIST数字识别任务！技术頭條網

2018-05-23 21:11:45 AI中國

卷积神经网络（CNN）是当前用于图像分类任务的最先进的体系结构。无论是面部识别、自动驾驶汽车还是物体检测，CNN都被广泛使用。在这篇文章中，我们设计了一个简单的二维卷积神经网络（CNN）模型，该模型使用具有张量流后端的keras，用于众所周知的MNIST数字识别任务。整个工作流程可以是：

准备数据
建立和编译模型
训练和评估模型
将模型保存到磁盘以供重用

准备数据

这里使用的数据集是如上所述的MNIST数据集。 MNIST数据库（修改后的国家标准与技术研究院数据库）是手写数字（0至9）的大型数据库。该数据库包含60,000个训练图像和10,000个每个大小为28x28的测试图像。第一步是加载数据集，这可以通过keras api轻松完成。

从这里可以看出，在左上角存储的图像'5'是X_train [0]，y_train [0]包含标签’5'。我们的深度学习模式应该只能够手写图像并预测写入的实际数字。

手把手教你用一个简单的2DCNN完成MNIST数字识别任务！

现在，为了准备数据，我们需要对图像进行一些处理，如调整图像大小，对像素值进行归一化等。

手把手教你用一个简单的2DCNN完成MNIST数字识别任务！

在对图像信息进行必要的处理之后，标签数据即y_train和y_test需要被转换为分类格式，如标签'3'应该被转换为向量[ 0，0，0]用于建模。

手把手教你用一个简单的2DCNN完成MNIST数字识别任务！

建立和编译模型

在数据准备好提供给模型后，我们需要定义模型的体系结构并使用必要的优化函数、损失函数和性能指标进行编译。

这里遵循的体系结构是2个卷积层，接着是合并层，分别是完全连接层和softmax层。在每个卷积层使用多个滤波器，用于不同类型的特征提取。一个直观的解释是，如果第一个过滤器有助于检测图像中的直线，第二个过滤器将有助于检测圆圈等等。每层技术执行的解释将成为即将发布的文章的一部分。在maxpooling和完全连接层之后，在我们的模型中引入dropout作为正则化来减少过度拟合问题。

在maxpooling和完全连接层之后，在我们的模型中引入dropout作为正则化来减少过度拟合问题。

手把手教你用一个简单的2DCNN完成MNIST数字识别任务！