简介
LeNet-5 是一种卷积神经网络(CNN),由 Yann LeCun 于 1998 年提出。它是 CNN 的早期先驱,并在图像识别领域取得了开创性的成功。LeNet-5 的结构简单有效,至今仍在图像分类和识别任务中广泛使用。
结构
LeNet-5 的结构包括以下几层:
1. 卷积层 1
输入:32x32x1(灰度图像)
卷积核:6 个 5x5 卷积核
输出:6 个 28x28x6 特征图
2. 平均池化层 1
池化:2x2 最大池化
输出:6 个 14x14x6 特征图
3. 卷积层 2
输入:6 个 14x14x6 特征图
卷积核:16 个 5x5 卷积核
输出:16 个 10x10x16 特征图
4. 平均池化层 2
池化:2x2 最大池化
输出:16 个 5x5x16 特征图
5. 全连接层 1
输入:16x5x5x16 展开的特征图
神经元:120 个
输出:120 个神经元
6. 全连接层 2
输入:120 个神经元
神经元:84 个
输出:84 个神经元
7. 输出层
输入:84 个神经元
神经元:10 个(对应 10 个数字类别)
输出:10 个分类概率
运作原理
LeNet-5 采用卷积和池化操作来提取图像中的特征。卷积层通过滑动的卷积核在输入图像上进行卷积,产生特征图。池化层通过将特征图中的相邻元素合并为单一值来减少特征图的大小。此过程反复进行,随着网络的深入,提取的特征变得越来越复杂。最后的全连接层将提取的特征映射到分类结果。
应用
LeNet-5 广泛用于图像分类和识别任务,包括:
手写数字识别
人脸识别
交通标志识别
优点
结构简单,易于训练
在图像分类任务上表现出色
成为现代 CNN 的基础
缺点
仅适用于小图像(32x32 像素)
对于复杂的任务可能不够深
**简介**LeNet-5 是一种卷积神经网络(CNN),由 Yann LeCun 于 1998 年提出。它是 CNN 的早期先驱,并在图像识别领域取得了开创性的成功。LeNet-5 的结构简单有效,至今仍在图像分类和识别任务中广泛使用。**结构**LeNet-5 的结构包括以下几层:**1. 卷积层 1** * 输入:32x32x1(灰度图像) * 卷积核:6 个 5x5 卷积核 * 输出:6 个 28x28x6 特征图**2. 平均池化层 1** * 池化:2x2 最大池化 * 输出:6 个 14x14x6 特征图**3. 卷积层 2** * 输入:6 个 14x14x6 特征图 * 卷积核:16 个 5x5 卷积核 * 输出:16 个 10x10x16 特征图**4. 平均池化层 2** * 池化:2x2 最大池化 * 输出:16 个 5x5x16 特征图**5. 全连接层 1** * 输入:16x5x5x16 展开的特征图 * 神经元:120 个 * 输出:120 个神经元**6. 全连接层 2** * 输入:120 个神经元 * 神经元:84 个 * 输出:84 个神经元**7. 输出层** * 输入:84 个神经元 * 神经元:10 个(对应 10 个数字类别) * 输出:10 个分类概率**运作原理**LeNet-5 采用卷积和池化操作来提取图像中的特征。卷积层通过滑动的卷积核在输入图像上进行卷积,产生特征图。池化层通过将特征图中的相邻元素合并为单一值来减少特征图的大小。此过程反复进行,随着网络的深入,提取的特征变得越来越复杂。最后的全连接层将提取的特征映射到分类结果。**应用**LeNet-5 广泛用于图像分类和识别任务,包括:* 手写数字识别 * 人脸识别 * 交通标志识别**优点*** 结构简单,易于训练 * 在图像分类任务上表现出色 * 成为现代 CNN 的基础**缺点*** 仅适用于小图像(32x32 像素) * 对于复杂的任务可能不够深