常见归一化公式

张

张建站

2026/5/6 7:46:27

10分钟阅读

内容来源于Gemini3.1pro最大绝对值归一化这是最简单的线性缩放直接按比例将数据映射到[−1,1][-1, 1][−1,1]区间不改变数据的中心位置0值仍然是0。x′x∣x∣max⁡xmax⁡(∣x1∣,∣x2∣,…,∣xn∣) x \frac{x}{|x|_{\max}}\frac{x}{\max(|x_1|, |x_2|, \dots, |x_n|)}x′∣x∣maxxmax(∣x1∣,∣x2∣,…,∣xn∣)xxxx当前正在处理的原始数值。x′xx′归一化后的新数值。∣x∣max⁡|x|_{\max}∣x∣max整组数据中绝对值的最大值。即∣x∣max⁡max⁡(∣x1∣,∣x2∣,…,∣xn∣)|x|_{\max} \max(|x_1|, |x_2|, \dots, |x_n|)∣x∣maxmax(∣x1∣,∣x2∣,…,∣xn∣)。最小最大归一化这是最基础的平移加缩放变换通常将数据完全映射到[0,1][0, 1][0,1]区间。x′x−xmin⁡xmax⁡−xmin⁡ x \frac{x - x_{\min}}{x_{\max} - x_{\min}}x′xmax−xminx−xminxxx原始数值。x′xx′归一化后的新数值。xmin⁡x_{\min}xmin整组数据中的最小值。xmax⁡x_{\max}xmax整组数据中的最大值。xmax⁡−xmin⁡x_{\max} - x_{\min}xmax−xmin整组数据的极差Range代表数据跨度的总宽度。均值归一化在最小最大归一化的基础上把减去最小值改成了减去平均值。这样做的结果不仅将数据缩放还会将数据的中心平均位置平移到 0。x′x−μxmax⁡−xmin⁡x−1n∑i1nxixmax⁡−xmin⁡ x \frac{x - \mu}{x_{\max} - x_{\min}} \frac{x - \frac{1}{n}\sum_{i1}^{n}x_i}{x_{\max} - x_{\min}}x′xmax−xminx−μxmax−xminx−n1∑i1nxix,x′,xmin⁡,xmax⁡x, x, x_{\min}, x_{\max}x,x′,xmin,xmax含义同上。μ\muμ整组数据的算术平均值Mean即μ1n∑i1nxi\mu \frac{1}{n}\sum_{i1}^{n}x_iμn1∑i1nxi。Z-score 标准化引入了更复杂的统计学矩方差/标准差。它不依赖极值极大或极小而是利用整体数据的分布特征将数据转化为均值为 0、标准差为 1 的标准分布。x′x−μσx−μ1n∑i1n(xi−μ)2 x \frac{x - \mu}{\sigma}\frac{x - \mu}{\sqrt{\frac{1}{n}\sum_{i1}^{n}(x_i - \mu)^2}}x′σx−μn1∑i1n(xi−μ)2x−μxxx原始数值。x′xx′归一化后的新数值。μ\muμ整组数据的算术平均值。σ\sigmaσ整组数据的标准差Standard Deviation衡量整组数据偏离平均值的平均离散程度。公式为σ1n∑i1n(xi−μ)2\sigma \sqrt{\frac{1}{n}\sum_{i1}^{n}(x_i - \mu)^2}σn1∑i1n(xi−μ)2。L2L_2L2范数归一化从代数/几何的视角出发将这组数据XXX看作高维空间中的一个向量。它的目的是按比例缩放这个向量使其长度欧几里得距离变为 1从而变成一个单位向量。x′x∥X∥2x∑i1nxi2 x \frac{x}{\|X\|_2} \frac{x}{\sqrt{\sum_{i1}^{n} x_i^2}}x′∥X∥2x∑i1nxi2xxxx原始数据集合中的某一个数值即向量的一个分量。x′xx′归一化后的数值。∥X∥2\|X\|_2∥X∥2整组数据构成的向量的L2L_2L2范数即向量的模长或几何长度。计算方式是将整组数据中每一个数求平方全部相加后再开平方根。

大语言模型在单元测试生成中的应用与实践

1. 大语言模型如何改变单元测试编写方式单元测试作为软件开发中最基础的验证手段，长期以来都依赖开发人员手动编写。这种方式不仅耗时费力，还容易遗漏边界条件。三年前我在一个金融系统项目中，团队花了近30%的开发时间在编写测试用例上&#…...

2026/5/6 7:39:45 阅读更多 →

Arm Cortex-A710处理器关键错误分析与解决方案

1. Arm Cortex-A710处理器关键错误深度解析作为Armv9架构下的高性能处理器核心，Cortex-A710在移动计算和嵌入式领域扮演着重要角色。但在实际部署中，其复杂的微架构设计也不可避免地存在一些硬件错误（Errata）。这些错误可能影响内…...

2026/5/6 7:38:28 阅读更多 →

发卡器RF003.DLL接口—幽冥大陆(一百17)—东方仙盟

发卡器RF003.DLL 动态库VC调用简介RF003读卡器本公司第三代可读写RFID卡的读写设备，采用直接USB通讯(无虚拟串口号码)，读取RFID卡号DWORD _stdcall ReadRFID(uchar* RFID) 入口参数: uchar* RFID : 读取到的RFID码的数组指针,数组大小4字节函数返回&am…...

2026/5/6 7:31:46 阅读更多 →

环境配置与基础教程：2026自动化标注黑科技：使用 Segment Anything (SAM) 零样本辅助标注 YOLO 分割与检测数据集

编者按在计算机视觉项目中，数据标注一直是最让人头疼的环节。根据社区普遍反馈（源自多个CSDN项目经验和公开技术报告），传统人工标注一张包含精细多边形掩码的图像需要3到10分钟，而一个完整的实例分割数据集往往需要上千张图片。如果你曾经带领团队连续加班数周只为了完成…...

2026/5/5 4:30:13 阅读更多 →

如何3步完成TikTok评论数据采集：开源工具的高效实战指南

如何3步完成TikTok评论数据采集：开源工具的高效实战指南【免费下载链接】TikTokCommentScraper 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokCommentScraper TikTokCommentScraper是一个专为抖音内容创作者、市场分析师和社区运营者设计的开源数据…...

2026/5/5 4:28:39 阅读更多 →