归一化和标准化⁰

归一化(Normalization)

通常将数据范围限定在$[0, 1]$或者$[-1, 1]$。

Rescaling(重新缩放): 也叫最小-最大归一化(min-max normalization)，是一种线性转换，数据范围为$[0, 1]$。
$x^{\prime}=\frac{x-\min (x)}{\max (x)-\min (x)}$
若将数据范围限定在$[a, b]$，可以通过下列公式
$x^{\prime}=a + \frac{(b-a)(x-\min (x))}{\max (x)-\min (x)}$
Mean normalization(平均归一化)：$\bar{x}$ 是指$x$的均值
$x^{\prime}=\frac{x- \bar{x} }{\max (x)-\min (x)}$
其他：
- 对数转换：$x^{\prime}=\log_{10} (x)$
- 反余切转换：$x^{\prime}=atan(x) \times \frac{2}{\pi}$

将数据按比例缩放，使之落入一个小的特定区间。

Z-scroe: $\bar{x}$是均值，$\sigma$是标准差
$x^{\prime}=\frac{x- \bar{x} }{\sigma}$
单位化(Scaling to unit length):
$x^{\prime}=\frac{x}{\|x\|}$
其他：
- 小数定标：$x^{\prime}=\frac{x}{10^i}$，其中$\forall i, \max(|x’|) < 1$
- 对数Logistic： $x'=\frac{1}{1+e^{-x} }$

¹. https://en.wikipedia.org/w/index.php?title=Feature_scaling&oldid=973370127 Feature scaling ↩

². https://www.zhihu.com/question/20467170 标准化和归一化什么区别？ ↩

³. https://blog.csdn.net/weixin_36604953/article/details/102652160 标准化和归一化，请勿混为一谈，透彻理解数据变换 ↩

⁰. https://blog.csdn.net/zyf89531/article/details/45922151 归一化、标准化和正则化的关系 ↩