快速搭建一个手写数字识别的神经网络

学习机器学习的理论知识难免会觉得枯燥乏味，不妨可以先快速实现一个简单的神经网络。让一部分网络先跑起来，最后掌握理论知识。

这里我们选择的是手写数字mnist数据集，首先，我们导入数据集

from keras.datasets import mnist
import matplotlib.pyplot as plt

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
print(train_images.shape)

mnist已经将数据集分为训练集与测试集，训练集有60000张图片，测试集有10000张图片，每张图片由28*28的矩阵组成，我们先对一张图像的矩阵进行可视化。

digit = test_images[0]
plt.imshow(digit, cmap=plt.cm.binary)
plt.show()

为了加深理解，我们把0-9都选择一个样本进行可视化

num = 0
for i in range(len(train_images)):
    if train_labels[i] == num and num < 10:
        num += 1
        plt.subplot(3,4,num)
        plt.axis('off')
        plt.tight_layout()
        plt.imshow(train_images[i], cmap='gray', interpolation='none')
        plt.title("Class {}".format(train_labels[i]))

mnist数据集导入成功了，接下来，我们使用Keras快速搭建神经网络。

from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28*28,)))
network.add(layers.Dense(10, activation='softmax'))
network.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

Keras非常适合快速搭建网络，models.Sequential() 表示我们要把每一个数据处理层关联起来，layers.Dense(…)就是构造一个数据处理层。input_shape(28*28,)表示当前处理层接收的数据格式必须是长和宽都是28的二维数组。

到这里为止，我们的网络已经搭建好了。我们需要将数据输入到这个网络里，下面我们对数据集进行预处理。将长宽都为28的二维矩阵变为28*28的一维矩阵，由于每个像素的取值范围是0-255不便于计算，我们对数据进行了简单归一化。

train_images = train_images.reshape((60000, 28*28))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28*28))
test_images = test_images.astype('float32') / 25

图片的label我们不是很方便直接使用，我们将label转换为独热编码格式。

from keras.utils import to_categorical
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)
print("before change:" ,test_labels[0])
print("after change: ", test_labels[0])

数据预处理完毕，我们将数据输入网络进行训练。

network.fit(train_images, train_labels, epochs=10, batch_size = 128)

上面的代码中，train_images是用于训练的手写数字图片，train_labels对应的是图片的标记，batch_size 的意思是，每次网络从输入的图片数组中随机选取128个作为一组进行计算，每次计算的循环是10次。

可以看到进过训练后，acc越来越接近1，最后的network得到了一个class对象。我们使用测试集队训练的结果进行测试，验证模型的准确性。

test_loss, test_acc = network.evaluate(test_images, test_labels, verbose=1)
print(test_loss) 
print('test_acc', test_acc)

最后，我们输入一张图片，直观验证一下模型的识别效果。

from keras.datasets import mnist
i= 4
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
digit = test_images[i]
plt.imshow(digit, cmap=plt.cm.binary)
plt.show()
test_images = test_images.reshape((10000, 28*28))
res = network.predict(test_images)
print(res[i])
for k in range(res[i].shape[0]):
    if (res[i][k] == 1):
        print("the number for the picture is : ", k)
        break

我们将识别的第5张图片显示出来，通过肉眼判断它应该是数字4，神经网络识别后给出的结果也是数字4，可见网络经过训练后，具备了手写数字图像识别的能力。

The End

已发布

2018年10月25日

分类

机器学习

标签：

数据可视化, 机器学习

快速搭建一个手写数字识别的神经网络

评论

发表回复取消回复

快速搭建一个手写数字识别的神经网络

评论

发表回复 取消回复

发表回复取消回复