样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
数学上一般用E{[X-E(X)]^2}来度量随机变量X与其均值E(X)的偏离程度,称为X的方差。
定义
设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X)或DX。即D(X)=E{[X-E(X)]^2},而σ(X)=D(X)^0.5(与X有相同的量纲)称为标准差或均方差。
由方差的定义可以得到以下常用计算公式:
D(X)=E(X^2)-[E(X)]^2
S^2=[(x1-x拔)2+(x2-x拔)^2+(x3-x拔)^2+…+(xn-x拔)^2]/n
方差的几个重要性质(设一下各个方差均存在)。
(1)设c是常数,则D(c)=0。
(2)设X是随机变量,c是常数,则有D(cX)=(c^2)D(X)。
(3)设X,Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)。
(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c
一.方差的概念与计算公式
例1 两人的5次测验成绩如下:
X: 50,100,100,60,50 E(X )=72;
Y: 73, 70, 75,72,70 E(Y )=72。
平均成绩相同,但X 不稳定,对平均值的偏离大。
方差描述随机变量对于数学期望的偏离程度。
单个偏离是
消除符号影响
方差即偏离平方的均值,记为D(X ):
直接计算公式分离散型和连续型,具体为:
这里 是一个数。推导另一种计算公式
得到:“方差等于平方的均值减去均值的平方”,即
,
其中
分别为离散型和连续型计算公式。 称为标准差或均方差,方差描述波动程度。
二.方差的性质
1.设C为常数,则D(C) = 0(常数无波动);
2. D(CX )=C2 D(X ) (常数平方提取);
证:
特别地 D(-X ) = D(X ), D(-2X ) = 4D(X )(方差无负值)
3.若X 、Y 相互独立,则
证:记
则
前面两项恰为 D(X )和D(Y ),第三项展开后为
当X、Y 相互独立时,
,
故第三项为零。
特别地
独立前提的逐项求和,可推广到有限项。
两个数的N方的差 Xn-Yn