偏态分布异常数据的剔除

2024-12-27 01:24:39
推荐回答(2个)
回答1:

你的思路好像不对耶。。。数据有偏的话就不是异常点的问题了。试想,就算你通过剔除“异常点”把数据变成了正态的样子,你剔除的点的数目一定不是“个别”吧。。。所谓异常点剔除,指的都是“个别”剔除。。。

如果数据是整数型,尝试Poisson回归;
如果数据在某一两个点(例如Y=2和Y=3)的计数特别高,考虑数据在这一点膨胀的可能性。这种情形可以用EM算法解决(要编程,spss貌似不行)了。

如果数据不是整数型,尝试Box-Cox变换。

回答2:

lognormal 是 偏态分布,
log(数据)服从正态分布,基本可以用2δ原则剔除.