不一定,中心化处理只不过是为了能够方便解释而已,并不会影响各项回归系数。
数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者是数值相差较大所引起的误差。数据中心化指的就是变量减去它的均值。数据标准化指的就是数值减去均值,再除以标准差。通过中心化和标准化处理,能够得到均值为0,标准差为1的服从标准正态分布的数据。在一些实际问题当中,我们得到的样本数据都是多个维度的,也就是一个样本是用多个特征来表征的。很显然,这些特征的量纲和数值得量级都是不一样的,而通过标准化的处理,可以使得不同的特征具有相同的尺度(Scale)。这样,在学习参数的时候,不同特征对参数的影响程度就一样了。简而言之,当原始数据不同维度上的特征的尺度(单位)不一致的时候,需要标准化步骤对数据进行预处理。数据预处理,一般有数据归一化、标准化以及去中心化。归一化:是将数据映射到[01]或[-11]区间范围内,不同特征的量纲不同,值范围大小不同,存在奇异值,对训练有影响。标准化:是将数据映射到满足标准正态分布的范围内,使数据满足均值是0标准差是1。标准化同样可以消除不同特征的量纲。去中心化:就是使数据满足均值为0,但是对标准差没有要求。如果对数据的范围没有限定要求,则选择标准化进行数据预处理;如果要求数据在某个范围内取值,则采用归一化;如果数据不存在极端的极大极小值时,采用归一化;如果数据存在较多的异常值和噪音,采用标准化。
不一定,中心化处理只不过是为了方便解释而已,并不影响各项回归系数。(南心网 调节效应中心化处理)