设为首页|收藏本站|
开启左侧

[问答] 标准化和归一化什么区别?

[复制链接]
77832 5
helen003 发表于 2022-8-8 22:45:11 | 只看该作者 打印 上一主题 下一主题
 
标准化和归一化什么区别?


上一篇:你会借钱出去旅游么?
下一篇:说说我的奥地利移民之路
@



1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义,请点击“举报”按钮,其他联系方式或无法及时处理。
 

精彩评论5

正序浏览
跳转到指定楼层
沙发
hudu 发表于 2022-8-8 22:46:08 | 只看该作者
 
min-max 归一化的公式为:
 第1张图片
mean 归一化的公式为:
 第2张图片
其中 mean(x)、min(x) 和 max(x) 分别是样本数据的平均值、最小值和最大值。
标准化的公式为:
 第3张图片
其中  第4张图片 第5张图片 分别是样本数据的均值(mean)和标准差(std)。

光看公式不是很直观,来看一下图片:

 第6张图片

mean 归一化

 第7张图片

标准化

可以看到 mean 归一化和标准化都将数据分布中心移到原点,
归一化没有改变数据分布的形状,而标准化使样本数据的分布近似为某种分布(通常为正态分布)。

多说一句,有时候需要对图像进行标准化,那么这时就需要均值和标准差,实现方法如下:
rgb_mean = np.array([[0.485, 0.456, 0.406])
rgb_std = np.array([0.229, 0.224, 0.225])
new_image = (image.astype('float32') / 256 - rgb_mean) / rgb_std这里的均值和标准差是根据 imagenet 数据集计算的,可以作为通用的均值和标准差,
回复 支持 反对

使用道具 举报

 
板凳
ihfhqsr33236 发表于 2022-8-8 22:46:32 | 只看该作者
 
可以参考我博客https://blog.csdn.net/weixin_36604953/article/details/102652160

 第10张图片

 第11张图片

 第12张图片

 第13张图片

 第14张图片

 第15张图片
回复 支持 反对

使用道具 举报

 
地板
射吊英雄张⒊疯 发表于 2022-8-8 22:46:39 | 只看该作者
 
通常来说,它们都是指特征工程中的特征缩放过程,由于中文翻译的原因,网上对它们的解释也是五花八门,但其实我们不考虑它们的名字,直接看它们的作用和操作方法,可能会更容易理解。
使用特征缩放的作用是:

  • 使不同量纲的特征处于同一数值量级,减少方差大的特征的影响,使模型更准确。
  • 加快学习算法的收敛速度。
参考sklearn的官方文档的数据预处理章节,
5.3. Preprocessing data缩放过程可以分为以下几种:

  • 缩放到均值为0,方差为1(Standardization——StandardScaler())
  • 缩放到0和1之间(Standardization——MinMaxScaler())
  • 缩放到-1和1之间(Standardization——MaxAbsScaler())
  • 缩放到0和1之间,保留原始数据的分布(Normalization——Normalizer())
1就是常说的z-score归一化,2是min-max归一化。
举个例子来看看它们之间的区别,假设一个数据集包括「身高」和「体重」两个特征,它们都满足正态分布,画出原始数据图像为:

 第22张图片
使用1.StandardScaler()缩放,结果为:

 第23张图片
使用2.MinMaxScaler()缩放,结果为:

 第24张图片
使用3.MaxAbsScaler()缩放,结果为:

 第25张图片
使用4.Normalizer()缩放,结果为:

 第26张图片
按需选择。

附:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import preprocessing

def plot(data, title):
    sns.set_style('dark')
    f, ax = plt.subplots()
    ax.set(ylabel='frequency')
    ax.set(xlabel='height(blue) / weight(green)')
    ax.set(title=title)
    sns.distplot(data[:, 0:1], color='blue')
    sns.distplot(data[:, 1:2], color='green')
    plt.savefig(title + '.png')
    plt.show()

np.random.seed(42)
height = np.random.normal(loc=168, scale=5, size=1000).reshape(-1, 1)
weight = np.random.normal(loc=70, scale=10, size=1000).reshape(-1, 1)

original_data = np.concatenate((height, weight), axis=1)
plot(original_data, 'Original')

standard_scaler_data = preprocessing.StandardScaler().fit_transform(original_data)
plot(standard_scaler_data, 'StandardScaler')

min_max_scaler_data = preprocessing.MinMaxScaler().fit_transform(original_data)
plot(min_max_scaler_data, 'MinMaxScaler')

max_abs_scaler_data = preprocessing.MaxAbsScaler().fit_transform(original_data)
plot(max_abs_scaler_data, 'MaxAbsScaler')

normalizer_data = preprocessing.Normalizer().fit_transform(original_data)
plot(normalizer_data, 'Normalizer')

robust_scaler_data = preprocessing.RobustScaler().fit_transform(original_data)
plot(robust_scaler_data, 'RobustScaler')
回复 支持 反对

使用道具 举报

 
5#
悲伤战歌 发表于 2022-8-8 22:47:27 | 只看该作者
 
正在做相关的作业,我来做一些小小的努力,不让概念太混乱
查看了@龚焱 的回答中提到的wiki 大致意思是归一化和标准化都属于四种Feature scaling(特征缩放),这四种分别是

  • Rescaling (min-max normalization)  有时简称normalization(有点坑) 第32张图片
  • Mean normalization   第33张图片
  • Standardization(Z-score normalization)   第34张图片
  • Scaling to unit length   第35张图片
对比了一下其它回答和一些博客,一般把第一种叫做归一化,第三种叫做标准化.不是很清楚是怎么翻译的.正则化的英文应该是Regularization,有些博客把这也弄混了.正则化是完全不同的事情了.
然后关于在ML里面是用第一个好还是第三个好,感觉大家都讨论的很激烈.有的认为取决于你的数据的特点(是否稀疏),有的认为取决于数据是否有明确的界限. 个人不太赞同只有归一化让椭圆变成了圆的想法,在我的梯度下降中,两种都加速得挺好...
回复 支持 反对

使用道具 举报

 
6#
yumemia 发表于 2022-8-8 22:48:02 | 只看该作者
 
我认真查了一天资料,这里有个大坑。网上各种资料,包括这个问题的所有回答都没有解释清楚。
问题在于大家讨论的概念内涵不统一,导致"标准化"和"归一化"这两个词长期被混用并被传播。
参考维基百科 Feature scaling - Wikipedia
"标准化"和"归一化"这两个中文词要指代四种Feature scaling(特征缩放)方法
Rescaling

 第36张图片
Mean normalization

 第37张图片
Standardization

 第38张图片
Scaling to unit length

 第39张图片

懒得写了,累了
附上踩的主要坑的链接:
数据标准化/归一化normalization - CSDN博客使用sklearn做单机特征工程 - jasonfreak - 博客园L2范数归一化 - CSDN博客纠正的链接:
Feature scalingNormalization(statistics)归一条件
回复 支持 反对

使用道具 举报

 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-4-29 08:22