1.ImageNet Classification with Deep Convolutional Neural Networks
ImageNet Classification with Deep Convolutional Neural Networks (利用深度卷积神经网络进行 ImageNet 分类)是 Alex Krizhevsky, Ilya Sutskever 和 Geoffrey E. Hinton 在 2012 年发表的一篇具有里程碑意义的论文。这篇论文描述了一种深度卷积神经网络(CNN),在 ImageNet 大规模视觉识别挑战赛(ILSVRC)中取得了显著的成功。
图片
2.Deep Residual Learning for Image Recognition
Deep Residual Learning for Image Recognition(深度残差学习在图像识别中的应用)是 Kaiming He, Xiangyu Zhang, Shaoqing Ren 和 Jian Sun 在 2015 年发表的一篇重要论文。
这篇论文介绍了一种新的深度神经网络架构,残差网络(ResNet),在 ImageNet 大规模视觉识别挑战赛(ILSVRC)中取得了突破性的成功。
图片
3.A Few Useful Things to Know about Machine Learning
A Few Useful Things to Know about Machine Learning 是 Pedro Domingos 于 2012 年发表的一篇重要论文,旨在为机器学习实践者和研究人员提供一些实用的见解和建议,涵盖了从模型选择、特征工程、正则化到数据质量和并行计算等多个方面。这些实用的建议有助于更好地理解和应用机器学习技术,提高模型的性能和可靠性。
图片
https://sites.astro.caltech.edu/~george/ay122/cacm12.pdf
4.Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 是 Sergey Ioffe 和 Christian Szegedy 在 2015 年提出的一篇重要论文。
它提出了一种简单而有效的方法,通过在每一层的输入上进行归一化操作,显著加速了深度神经网络的训练过程,增强了训练的稳定性,并提高了模型的最终性能。
批量归一化已成为深度学习中标准的技巧,被广泛应用于各种网络架构和任务中。
图片
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/43442.pdf
5.Sequence to Sequence Learning with Neural Networks
Sequence to Sequence Learning with Neural Networks 是 Ilya Sutskever、Oriol Vinyals 和 Quoc V. Le 在 2014 年提出的一篇具有里程碑意义的论文。
论文提出了一种革命性的架构(Seq2Seq),显著推动了序列到序列任务的发展。Seq2Seq 模型通过编码器-解码器结构,将输入序列映射到输出序列,在机器翻译等任务中取得了显著的成功。这一模型的提出不仅开创了新的研究方向,还激发了后续大量的改进和创新,如注意力机制和 Transformer 模型。Seq2Seq 已成为自然语言处理和其他序列到序列任务中的基础方法。
图片
6.Generative Adversarial Nets
Generative Adversarial Nets (GANs) 是由 Ian Goodfellow 等人在 2014 年提出的。
GANs 的核心思想是通过两个神经网络,生成器(Generator)和判别器(Discriminator)相互竞争,从而生成逼真的数据。
图片
7.High-Speed Tracking with Kernelized Correlation Filters
High-Speed Tracking with Kernelized Correlation Filters 是由 João F. Henriques, Rui Caseiro, Pedro Martins, 和 Jorge Batista 在 2015 年发表的。
这篇论文提出了一种高效的目标跟踪方法,称为 Kernelized Correlation Filters (KCF),在保持高效计算的同时,提供了优越的跟踪性能。
图片
https://arxiv.org/pdf/1404.7584
8.YOLO9000: Better, Faster, Stronger
YOLO9000: Better, Faster, Stronger 是由 Joseph Redmon 和 Ali Farhadi 于 2016 年提出的一篇重要论文。
这篇论文介绍了一种新的实时目标检测系统 YOLO9000,它不仅能够在现有的目标检测任务上表现出色,还可以检测超过 9000 种对象类别。
它提出了一种改进的目标检测模型,通过联合训练和层级分类器等创新方法,显著提升了目标检测的速度和准确性,并扩展了可检测对象的种类。YOLO9000 在多个对象检测基准测试中表现优异,是目标检测领域的一项重要进展。
图片
此版本的 YOLO 系统实现了卓越的性能指标,可检测超过 9000 个项目类别,并击败了 SSD 和 Faster R-CNN with ResNet 等竞争方法。在 VOC 2007 数据集上,YOLOv2 以每秒 67 帧的速度获得 76.8 mAP,在 COCO 上以每秒 40 帧的速度获得 78.6 mAP,取得了令人鼓舞的结果。
https://arxiv.org/abs/1612.08242
9.Fast R-CNN
Fast R-CNN 是由 Ross Girshick 在 2015 年提出的一篇重要论文。
该论文介绍了一种高效的目标检测方法,称为 Fast R-CNN,它通过共享卷积特征、RoI 池化和多任务损失函数,显著提升了目标检测的速度和精度。Fast R-CNN 在多个基准测试中表现出色,是目标检测领域的一项重要进展。它为后续的检测算法(如 Faster R-CNN 和 Mask R-CNN)奠定了基础,对计算机视觉的发展产生了深远影响。
图片
https://arxiv.org/abs/1504.08083
10.Large-scale Video Classification with Convolutional Neural Networks
Large-scale Video Classification with Convolutional Neural Networks 是由 André Karpathy 等人在 2014 年提出的一篇论文。
这篇论文提出了一种基于 CNN 的大规模视频分类方法,通过多种时间维度处理策略,实现了高效的视频分类。
论文通过大规模实验验证了方法的有效性,对视频理解和计算机视觉领域产生了重要影响。
图片