一文彻底搞懂深度学习归一化Normalization

2025-01-01 约 2360 字预计阅读 5 分钟

https://bing.ee123.net/img/rand?artid=143967683

一文彻底搞懂深度学习：归一化（Normalization）

在深度学习中，归一化是数据预处理中一个至关重要的步骤。归一化技术通过调整输入数据的尺度，使得数据具有相似的分布范围，提高模型的求解速度和泛化能力。常用的归一化方法，包括批量归一化（Batch Normalization）、层归一化（Layer Normalization）、组归一化（Group Normalization）和实例归一化（Instance Normalization）等。

一、归一化

1、归一化（Normalization）是什么？

归一化是一种数据预处理技术，旨在将数据的数值范围缩放到一个特定的尺度，通常是为了消除不同特征之间的量纲差异，使得数据更加适合进行后续的分析和处理。归一化是深度学习中不可或缺的数据预处理步骤。通过合理的归一化处理，可以显著提高模型的训练效率和性能，为深度学习模型的优化和泛化能力的提升提供有力支持。

2、为什么需要归一化？

由于目标函数拥有众多参数且结构复杂，直接寻找最优参数变得十分困难。因此，我们需要借助优化器，它能够逐步调整参数，确保每次优化都朝着最快降低损失的方向前进。

3、归一化的过程是什么？

归一化是通过确定数据的取值范围，*应用相应的归一化公式将数据转换到新的稳定尺度，从而得到更加适合后续分析和处理的数据集的过程。

确定归一化的范围：确定数据的取值范围， 即数据的最大值和最小值 。在某些情况下，也可以根据需要选择其他统计量（如均值和标准差）来确定归一化的范围。
应用归一化公式：根据选定的归一化范围， 应用相应的归一化公式将数据转换到新的尺度 。常见的归一化公式包括线性函数归一化（将数据映射到[0,1]或[-1,1]的范围）和Z-score标准化（将数据转换为标准正态分布）。
得到归一化后的数据：应用归一化公式后，即 可得到新的、经过归一化处理的数据集 。这些数据集在数值上更加稳定，有利于后续的分析和处理。

二、常用的归一化

常用的归一化有哪些？ 常用的归一化主要包括批量归一化（BN）、层归一化（LN）、组归一化（GN）和实例归一化（IN）等，它们各有其独特的应用场景和优势，选择哪种归一化方法通常取决于具体任务和数据的特点。

1. 批量归一化（Batch Normalization, BN）

方法：在神经网络的每一层中， 对每个mini-batch的输入进行归一化处理 。通过减去均值，再除以标准差，将输入数据转化为均值为0，标准差为1的分布。
优点： 加速网络训练、防止梯度问题 、优化正则化效果、降低学习率要求， 并有助于缓解过拟合 ，从而显著提升神经网络的性能和稳定性。
应用场景： 适用于大多数神经网络场景，特别是在训练深层网络时。

2. 层归一化（Layer Normalization, LN）

方法：在神经网络的每一层中， 对每个样本的所有特征维度进行归一化处理 。通过减去均值，再除以标准差，将每个样本的特征维度转化为均值为0，标准差为1的分布。
优点： 在训练样本较小、样本间相互影响较大的情况下更稳定。
应用场景 ： 如循环神经网络（RNN）等场景。

3. 实例归一化（Instance Normalization, IN）

方法： 对每个样本的特征维度进行归一化。通过减去均值，再除以标准差，将每个样本的特征维度转化为均值为0，标准差为1的分布。
优点： 更适用于图像生成等任务中，每个样本的特征维度独立于其他样本的情况。
应用场景 ：图像生成任务等。

4. 组归一化（Group Normalization, GN）

方法： 在神经网络的每一层中， 将特征分成若干组 ，对每个组的特征进行归一化处理。通过减去均值，再除以标准差，将每个组的特征维度转化为均值为0，标准差为1的分布。
优点： 适用于样本较小、样本间相互影响较大，但又不需要对整个mini-batch进行归一化的情况。
应用场景： 图像分割任务等。

三、最后分享

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。

这里给大家精心整理了一份 全面的AI大模型学习资源 ，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等， 资料免费分享 ！

1. 成长路线图&学习规划

要学习一门新的技术，作为新手一定要 先学习成长路线图 ， 方向不对，努力白费 。这里，我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的，我们精选了一系列深入探讨大模型技术的书籍和学习文档， 它们由领域内的顶尖专家撰写，内容全面、深入、详尽，为你学习大模型提供坚实的理论基础 。 （书籍含电子版PDF）

3. 大模型视频教程

对于很多自学或者没有基础的同学来说，书籍这些纯文字类的学习教材会觉得比较晦涩难以理解，因此，我们 提供了丰富的大模型视频教程 ，以动态、形象的方式展示技术概念， 帮助你更快、更轻松地掌握核心知识 。

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用 ，当你的理论知识积累到一定程度，就需要通过项目实战， 在实际操作中检验和巩固你所学到的知识 ，同时为你找工作和职业发展打下坚实的基础。

6. 大模型面试题

面试不仅是技术的较量，更需要充分的准备。在你已经掌握了大模型技术之后，就需要开始准备面试，我们将提供精心整理的大模型面试题库，涵盖当前面试中可能遇到的各种技术问题，让你在面试中游刃有余。

全套的AI大模型学习资源已经整理打包，有需要的小伙伴可以 微信扫描下方CSDN官方认证二维码 ，免费领取【 保证100%免费 】