使用机器学习对图片进行分类

人工智能 机器学习
在入门教程《在macOS上编写TensorFlow程序》中使用TensorFlow对手写的数字进行分类,本篇文章将对衣服、鞋子等服装图片进行分类。

服装数据集

服装数据集和MNIST数据集很像,有需要的可以查看教程《MNIST数据集》,包含70000个灰度图,每个图片28 x 28像素。

时装数据集

在这里将使用60000张图片进行训练,使用10000张图片进行评估,可以直接使用Keras进行加载。

fashion_mnist = tf.keras.datasets.fashion_mnist(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

所有的图片可分为10个种类:

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

数据预处理:

在将数据送入到神经网络训练之前,需要对数据进行预处理,查看一张训练的图片,像素值的分布范围为[0, 255]

鞋子

对数据进行归一化处理:

train_images = train_images / 255.0test_images = test_images / 255.0

为了验证数据的正确性,展示前25张图片以及图片的分类:

服装

建立模型

神经网络基础模块就是层(Layer),层会从传递的数据中提取特征,这些特征对问题的解决很有帮助。

很多深度学习都是由一系列简单的层串联而成,大部分的层比如Dense,在训练过程中有可学习的参数。

model = tf.keras.Sequential([    tf.keras.layers.Flatten(input_shape=(28, 28)),    tf.keras.layers.Dense(128, activation='relu'),    tf.keras.layers.Dense(10)])

Flatten层将二维(28 x 28)的图片转化为一维的数组,这一层没有参数可以学习,仅仅只是格式化数据。

第一个Dense层有128个节点或者说神经元,第二个Dense层返回长度为10的数组,每个节点包含当前图片属于哪个分类的得分。

模型编译

模型需要进行三个设置:

  1. 损失函数 - 这个主要用于评估模型在训练过程中的准确性
  2. 优化器 - 模型如何更新
  3. 量度 - 用于监测训练和测试步骤
model.compile(optimizer='adam',              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),              metrics=['accuracy'])

填入训练数据:

model.fit(train_images, train_labels, epochs=10)

评估模型的正确性:

test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)print('Test accuracy:', test_acc)

显示结果:

Test accuracy: 0.8835999965667725

训练过程输出:

1875/1875 [==============================] - 1s 523us/step - loss: 0.2379 - accuracy: 0.9110

可以看到测试数据的正确性是要略低于训练数据的正确性的,这个训练和测试的差距叫做overfitting(过拟合),过拟合发生在机器学习模型对于没有处理过的数据表现更差。

预测

模型训练之后,你可以使用它来对一些图片进行预测,添加一个Softmax层将结果转换为置信度,它更容易被理解

predictions = probability_model.predict(test_images)print(predictions[0])

可以看到第0张测试图片属于每个分类的置信度:

[4.7003473e-07 2.8711662e-09 1.8403462e-08 3.7643213e-09 2.0236126e-08 8.2177273e-04 1.0194674e-06 9.5114678e-02 2.8414237e-07 9.0406173e-01]

第9个数据的置信度最高,通过打印图片的标签也是9,说明预测正确。

随机选择一些图片输出:

置信度分布

第13张图片81%的可能性是凉鞋,说明机器学习预测错误,它应该是跑鞋。

也可以对单张图片进行预测,虽然是单张图片,但是Keras仍然需要数组进行传递,将图片添加到集合中。

img = (np.expand_dims(img, 0))

进行预测:

predictions_single = probability_model.predict(img)

总结

以上就是建立神经网络的简单过程,分为数据处理、模型的训练、预测等几个步骤。

责任编辑:华轩 来源: 今日头条
相关推荐

2022-06-05 21:16:08

机器学习Python

2020-02-03 08:00:00

机器学习人工智能AI

2022-06-09 09:14:31

机器学习PythonJava

2017-12-12 13:17:36

机器学习代码单元测试

2019-09-30 10:12:21

机器学习数据映射

2018-06-14 14:05:48

机器学习大数据卡通上色

2022-10-30 15:00:40

小样本学习数据集机器学习

2023-02-06 18:28:09

机器学习模型

2024-10-18 08:17:36

2009-12-08 18:08:43

WCF服务

2022-02-13 00:27:34

机器学习数字隐私技术

2019-01-23 11:45:47

机器学习人工智能机器人

2021-03-10 14:21:33

人工智能机器学习算法

2010-03-16 16:11:41

交换机堆叠技术

2024-10-30 16:59:57

Python机器学习

2023-05-14 22:35:24

TensorFlowKeras深度学习

2017-09-17 23:14:41

机器学习人工智能设计

2010-05-26 18:43:42

SVN库

2021-03-29 10:56:51

人工智能深度学习

2021-05-09 22:48:40

SQL数据库变量
点赞
收藏

51CTO技术栈公众号