内容来源于Gemini3.1pro最大绝对值归一化这是最简单的线性缩放直接按比例将数据映射到[−1,1][-1, 1][−1,1]区间不改变数据的中心位置0值仍然是0。x′x∣x∣max⁡xmax⁡(∣x1∣,∣x2∣,…,∣xn∣) x \frac{x}{|x|_{\max}}\frac{x}{\max(|x_1|, |x_2|, \dots, |x_n|)}x′∣x∣max​x​max(∣x1​∣,∣x2​∣,…,∣xn​∣)x​xxx当前正在处理的原始数值。x′xx′归一化后的新数值。∣x∣max⁡|x|_{\max}∣x∣max​整组数据中绝对值的最大值。即∣x∣max⁡max⁡(∣x1∣,∣x2∣,…,∣xn∣)|x|_{\max} \max(|x_1|, |x_2|, \dots, |x_n|)∣x∣max​max(∣x1​∣,∣x2​∣,…,∣xn​∣)。最小最大归一化这是最基础的平移加缩放变换通常将数据完全映射到[0,1][0, 1][0,1]区间。x′x−xmin⁡xmax⁡−xmin⁡ x \frac{x - x_{\min}}{x_{\max} - x_{\min}}x′xmax​−xmin​x−xmin​​xxx原始数值。x′xx′归一化后的新数值。xmin⁡x_{\min}xmin​整组数据中的最小值。xmax⁡x_{\max}xmax​整组数据中的最大值。xmax⁡−xmin⁡x_{\max} - x_{\min}xmax​−xmin​整组数据的极差Range代表数据跨度的总宽度。均值归一化在最小最大归一化的基础上把减去最小值改成了减去平均值。这样做的结果不仅将数据缩放还会将数据的中心平均位置平移到 0。x′x−μxmax⁡−xmin⁡x−1n∑i1nxixmax⁡−xmin⁡ x \frac{x - \mu}{x_{\max} - x_{\min}} \frac{x - \frac{1}{n}\sum_{i1}^{n}x_i}{x_{\max} - x_{\min}}x′xmax​−xmin​x−μ​xmax​−xmin​x−n1​∑i1n​xi​​x,x′,xmin⁡,xmax⁡x, x, x_{\min}, x_{\max}x,x′,xmin​,xmax​含义同上。μ\muμ整组数据的算术平均值Mean即μ1n∑i1nxi\mu \frac{1}{n}\sum_{i1}^{n}x_iμn1​∑i1n​xi​。Z-score 标准化引入了更复杂的统计学矩方差/标准差。它不依赖极值极大或极小而是利用整体数据的分布特征将数据转化为均值为 0、标准差为 1 的标准分布。x′x−μσx−μ1n∑i1n(xi−μ)2 x \frac{x - \mu}{\sigma}\frac{x - \mu}{\sqrt{\frac{1}{n}\sum_{i1}^{n}(x_i - \mu)^2}}x′σx−μ​n1​∑i1n​(xi​−μ)2​x−μ​xxx原始数值。x′xx′归一化后的新数值。μ\muμ整组数据的算术平均值。σ\sigmaσ整组数据的标准差Standard Deviation衡量整组数据偏离平均值的平均离散程度。公式为σ1n∑i1n(xi−μ)2\sigma \sqrt{\frac{1}{n}\sum_{i1}^{n}(x_i - \mu)^2}σn1​∑i1n​(xi​−μ)2​。L2L_2L2​范数归一化从代数/几何的视角出发将这组数据XXX看作高维空间中的一个向量。它的目的是按比例缩放这个向量使其长度欧几里得距离变为 1从而变成一个单位向量。x′x∥X∥2x∑i1nxi2 x \frac{x}{\|X\|_2} \frac{x}{\sqrt{\sum_{i1}^{n} x_i^2}}x′∥X∥2​x​∑i1n​xi2​​x​xxx原始数据集合中的某一个数值即向量的一个分量。x′xx′归一化后的数值。∥X∥2\|X\|_2∥X∥2​整组数据构成的向量的L2L_2L2​范数即向量的模长或几何长度。计算方式是将整组数据中每一个数求平方全部相加后再开平方根。