AlphaGo 大战李世乭之后,深度学习技术便在国内变得异常火。吸引了大批的技术人员争相学习,那么到底如何才能更快速的入门深度学习呢?
下面给大家介绍的 18 个挑战项目,通过实践动手带你快速入门深度学习!
1.北京市住房价格预测
本挑战运用线性回归的相关知识,来预测北京市的住房价格。
该数据集中共包含有 12 列。由于线性回归需要输入数值型数据,所以我们选用的特征包括「公交,写字楼,医院,商场,地铁,学校,建造时间,楼层,面积」等 9 项,而「每平米价格」则是预测目标值。
2.梯度下降法实现与应用
梯度下降作为一种最优化方法,可以普遍用于参数问题的优化过程中。为了更好地体会这种方法的优点和了解其使用过程,本次挑战中将尝试使用梯度下降解决一些线性回归问题。
3.手写字符识别神经网络
本挑战结合 scikit-learn 提供的人工神经网络实现方法,完成手写字符识别。
4.TensorFlow 加州房价预测
本挑战尝试用 TensorFlow 去实现一个线性回归。你可能会觉得线性回归非常基础,不过这里的目的主要是熟悉 TensorFlow 搭建模型的整个流程,以及诸如 Placeholder,Constant 等重要概念。
5.TensorFlow 汽车评估分类
本挑战使用 TensorFlow 构建一个合理的全连接人工神经网络,完成汽车安全性评估分类任务。
需要使用 TensorFlow 函数及方法完成网络的构建,训练,预测及评估。自行选择数据处理方式,神经网络结构,损失函数,优化方法等。数据预处理等非主要代码允许少量使用其他类库提供的函数及操作。
6.TensorFlow 时尚物品分类
本挑战将由你独立完成一个开放性的分类预测练习,你需要使用 Fashion-MNIST 时尚物品数据集,并通过 TensorFlow Keras 来构建一个合理的 DNN 网络。
结果输出:
- Train on 60000 samples, validate on 10000 samples
- Epoch 1/5
- 60000/60000 [==============================] - loss: 0.3098 - acc: 0.8856 - val_loss: 0.3455 - val_acc: 0.8776
- Epoch 2/5
- 60000/60000 [==============================] - loss: 0.2981 - acc: 0.8891 - val_loss: 0.3352 - val_acc: 0.8784
- Epoch 3/5
- 60000/60000 [==============================] - loss: 0.2885 - acc: 0.8914 - val_loss: 0.3346 - val_acc: 0.8741
- Epoch 4/5
- 60000/60000 [==============================] - loss: 0.2802 - acc: 0.8942 - val_loss: 0.3349 - val_acc: 0.8808
- Epoch 5/5
- 60000/60000 [==============================] - loss: 0.2738 - acc: 0.8982 - val_loss: 0.3197 - val_acc: 0.8851
7.PyTorch 实现线性回归
本次挑战中,需要你使用 PyTorch 实现再熟悉不过的线性回归。线性回归固然简单,但挑战的目的在于熟悉对 PyTorch 的使用。
结果输出:
- Iteration [ 10/100], Loss: 0.791
- Iteration [ 20/100], Loss: 0.784
- Iteration [ 30/100], Loss: 0.778
- Iteration [ 40/100], Loss: 0.772
- Iteration [ 50/100], Loss: 0.767
- Iteration [ 60/100], Loss: 0.762
- Iteration [ 70/100], Loss: 0.757
- Iteration [ 80/100], Loss: 0.753
- Iteration [ 90/100], Loss: 0.749
- Iteration [100/100], Loss: 0.745
8.构建 LeNet5
本次挑战将使用 TensorFlow Estimator 高阶 API 来重构 LeNet-5 并完成训练。
9.迁移学习完成动物分类
本次挑战中,我们尝试使用 TensorFlow Keras 来训练动物分类迁移学习模型。
10.DCGAN 动漫人物图像生成
本次挑战中,你将了解的 GAN 的一种常见的结构 DCGAN,并使用它来搭建一个可以自动生成动漫头像的神经网络。
11.卷积自动编码器图像去噪
本次挑战中,需要独立构建一个包含卷积结构的自动编码器,完成图片去噪任务。
12.YOLO 图像目标检测应用
YOLO 是区别于 R-CNN 的另一类常用目标检测方法。本次挑战中,你需要独立尝试利用相关的工具,来使用 YOLO 完成目标检测应用。
13.LSTM 预测股票价格
股票交易走势预测是量化交易涉及的工作之一,即通过统计学和机器学习的手段来分析和预测价格走势情况。一般情况下,我们可以使用时间序列相关的建模方法,但本次挑战将尝试使用 LSTM 完成股票预测分析。
14.深度学习完成假新闻分类
深度学习在自然语言处理中有十分重要的应用,本次挑战需要借助循环神经网络的知识,提升假新闻文本分类的准确率。
15.BERT 预训练技术实践应用
2018 年,自然语言处理领域最大的新闻之一莫过于 Google BERT 的横空出世。Google BERT 声称是最先进的 NLP 预训练技术,支持中文和更多语言。相关论文中,BERT 展示了包括斯坦福问答数据集(SQUAD v1.1)在内 11 个 NLP 任务的最新结果,均取得了最好的效果。
本次挑战利用 Google BERT 提供的中文预训练语言模型,完成假新闻数据文本分类任务。我们建议你对提供的数据进行 8:2 切分,并最终得到测试集上的准确度。
16.仙人掌航拍照片分类识别
Aerial Cactus Identification 是 Kaggle 上一个机器学习入门级比赛,本次挑战将使用 Auto-Keras 自动化深度学习框架完成该比赛。
17.构建图像分类推理服务
本次挑战中,你需要尝试使用 TensorFlow Keras 提供的预训练模型构建一个图像分类实时推理 API 接口。实现一个由 MobileNetV2 预训练模型构建的图像分类实时推理 API,并能够利用其对任意通过 POST 请求传入的图片进行推理。
18.云服务识别增值税发票
本次挑战中,你需要调用百度云提供的增值税发票识别接口,完成对增值税发票图片识别任务。