方差(variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
方差公式:
平均数:
(n表示这组数据个数,x1、x2、x3……xn表示这组数据具体数值)
方差公式:
一.方差的概念与计算公式
例1 两人的5次测验成绩如下:
X: 50,100,100,60,50 E(X )=72;
Y: 73, 70, 75,72,70 E(Y )=72。
平均成绩相同,但X 不稳定,对平均值的偏离大。
方差描述随机变量对于数学期望的偏离程度。
单个偏离是
消除符号影响
方差即偏离平方的均值,记为D(X ):
直接计算公式分离散型和连续型,具体为:
这里 是一个数。推导另一种计算公式
得到:“方差等于平方的均值减去均值的平方”,即
,
其中
分别为离散型和连续型计算公式。 称为标准差或均方差,方差描述波动程度。
二.方差的性质
1.设C为常数,则D(C) = 0(常数无波动);
2. D(CX )=C2 D(X ) (常数平方提取);
证:
特别地 D(-X ) = D(X ), D(-2X ) = 4D(X )(方差无负值)
3.若X 、Y 相互独立,则
证:记
则
前面两项恰为 D(X )和D(Y ),第三项展开后为
当X、Y 相互独立时,
,
故第三项为零。
特别地
独立前提的逐项求和,可推广到有限项。
三.常用分布的方差
1.两点分布
2.二项分布
X ~ B ( n, p )
引入随机变量 Xi (第i次试验中A 出现的次数,服从两点分布)
,
3.泊松分布(推导略)
4.均匀分布
另一计算过程为
5.指数分布(推导略)
6.正态分布(推导略)
~
正态分布的后一参数反映它与均值 的偏离程度,即波动程度(随机波动),这与图形的特征是相符的。
例2 求上节例2的方差。
解 根据上节例2给出的分布律,计算得到
工人乙废品数少,波动也小,稳定性好。
参考资料:http://site.ntvc.edu.cn/jx/jpkc/gs/jrkc/pt/pch3/gl32.htm
答:
定义
设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X)或DX。即D(X)=E{[X-E(X)]^2},而σ(X)=D(X)^0.5(与X有相同的量纲)称为标准差或均方差。
由方差的定义可以得到以下常用计算公式:
D(X)=E(X^2)-[E(X)]^2
S^2=[(x1-x拔)^2+(x2-x拔)^2+(x3-x拔)^2+…+(xn-x拔)^2]/n
方差的几个重要性质(设一下各个方差均存在)。
(1)设c是常数,则D(c)=0。
(2)设X是随机变量,c是常数,则有D(cX)=(c^2)D(X)。
(3)设X,Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)。
(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c。
方差是各个数据与平均数之差的平方的平均数,即
s^2=(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]
,其中,x_表示样本的平均数,n表示样本的数量,^2表示平方,xn表示个体,而s^2就表示方差。
而当用(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]作为总体X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的(n-1)/n倍,[1/(n-1)][(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]的数学期望才是X的方差,用它作为X的方差的估计具有“无偏性”,所以我们总是用[1/(n-1)]∑(Xi-X~)^2来估计X的方差,并且把它叫做“样本方差”。
常数的方差计算公式是什么呢