CNN的发展

模型的建立过程：

1959年，Hubel & Wiesel发现动物视觉皮层中的细胞负责检测感受野(receptive fields)中的光线。论文：Receptive fields and functional architecture of monkey striate cortex(1968)

1980年，Kunihiko Fukushima提出新认知机(neocognitron)，被认为是CNN的前身。论文：Neocognitron: A self-organizing neural network model for a mechanism of visual pattern recognition(1982)

1985年，Rumelhart和Hinton等人提出了后向传播(Back Propagation，BP)算法，使得神经网络的训练变得简单可行。论文：Learning internal representations by error propagation(Basic Mechanisms, 1985) / Learning representations by back-propagating errors(Nature, 1986)

1990年，LeCun建立了CNN的现代框架，利用BP算法来训练多层神经网络，用于识别手写邮政编码，论文中把5*5的相邻区域作为感受野。论文：Handwritten digit recognition with a back-propagation network(NIPS, 1989) / Backpropagation applied to handwritten zip code recognition(Neural Computation, 1989)

1998年，LeCun改进CNN，他们开发了一个名为LeNet-5的多层人工神经网络，可以对手写数字进行分类。与其他神经网络一样，LeNet-5具有多个层，可以通过反向传播算法进行训练。它可以获得原始图像的有效表示，这使得从原始像素直接识别视觉模式成为可能，而且很少进行预处理。论文：Gradient-based learning applied to document recognition(IEEE, 1998)

1990年，Zhang使用一个平移不变性的人工神经网络(SIANN)，识别图像的字符。但由于当时缺乏大量的训练数据和计算能力，他们的网络在更复杂的问题，例如大规模的图像和视频分类方面不能很好地运行。论文：Parallel distributed processing model with local space-invariant interconnections and its optical architecture(1990)

2012年，Alex Krizhevsky提出一个经典的CNN架构，即AlexNet。它显示了在图像分类任务上根据以前方法的重大改进，在整体结构上与LeNet-5类似，但深度更深。由此获得了2012大规模视觉识别挑战赛 (ILSVRC)的第一名，在百万量级的ImageNet数据集上，效果显著提升。论文：ImageNet Classification with Deep Convolutional Neural Networks(NIPS, 2012)

后续模型的改进：

ZFNet 论文：Visualizing and understanding convolutional networks(ECCV, 2014)

VGGNet 论文：Very deep convolutional networks for large-scale image recognition(ICLR, 2015)

GoogleNet 论文：Going deeper with convolutions(CVPR, 2015)

ResNet 论文：Deep residual learning for image recognition(CVPR, 2016)

GoogleNet和VGGNet是2014年ImageNet竞赛的双雄，这两类模型结构有一个共同特点是go deeper。跟VGGNet不同的是，GoogleNet做了更大胆的网络上的尝试，而不是像VGGNet继承了LeNet以及AlexNet的一些框架，该模型虽然有22层，但大小却比AlexNet和VGGNet都小很多，性能优越。

从架构的演变来看，一个典型的趋势是网络正在变得越来越深。通过增加深度，网络可以更好地近似（逼近）目标函数，增加非线性，并得到更好的特征表示。然而，这也增加了网络的复杂性，使网络变得更难以优化、更容易过拟合。在此基础上，许多works提出了解决这些问题的各种方法。

介绍CNN发展史的一些博客：

1、【卷积神经网络-进化史】从LeNet到AlexNe

http://blog.csdn.net/cyh_24/article/details/51440344

上图所示是刘昕博士总结的CNN结构演化的历史，起点是神经认知机模型，此时已经出现了卷积结构，经典的LeNet诞生于1998年。然而之后CNN的锋芒开始被SVM等手工设计的特征盖过。随着ReLU和dropout的提出，以及GPU和大数据带来的历史机遇，CNN在2012年迎来了历史突破–AlexNet。

AlexNet取得成功的主要原因：(1)大量数据，李飞飞团队的大型标注数据集合ImageNet；(2)高度并行的计算神器GPU；(3)算法的改进，包括网络变深、数据增强、ReLU、Dropout等。

2、#Deep Learning回顾#之LeNet、AlexNet、GoogLeNet、VGG、ResNet

https://www.cnblogs.com/52machinelearning/p/5821591.html

ILSVRC每年都不断被Deep Learning刷榜，如上图所示，随着模型变得越来越深，Top-5的错误率也越来越低，目前降到了3.5%附近。而在同样的ImageNet数据集合上，人眼的辨识错误率大概在5.1%，也就是目前的Deep Learning模型的识别能力已经超过了人眼。而图中标注的这些模型，也是Deep Learning视觉发展的里程碑式代表。

3、LeNet论文的翻译与CNN三大核心思想的解读

http://blog.csdn.net/qianqing13579/article/details/71076261

个人收藏笔记记录

开通VIP