因子分析从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。
它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。
对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。
因子分析模型描述如下:
⑴X=(x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。
⑵F=(F1,F2,…,Fm)¢(m<p)是不可测的向量,其均值向量E(F)=0,协方差矩阵Cov(F)=I,即向量的各分量是相互独立的。
⑶e=(e1,e2,…,ep)¢与F相互独立,且E(e)=0,e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:
x1=a11F1+a12F2+…+a1mFm+e1
x2=a21F1+a22F2+…+a2mFm+e2
………
xp=ap1F1+ap2F2+…+apmFm+ep
称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。
其矩阵形式为:x=AF+e.
其中:
x=,A=,F=,e=
这里,
⑴m£p;
⑵Cov(F,e)=0,即F和e是不相关的;
⑶D(F)=Im,即F1,F2,…,Fm不相关且方差均为1;
D(e)=,即e1,e2,…,ep不相关,且方差不同。
我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e称为X的特殊因子。
A=(aij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。
因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
(i)因子分析常常有以下四个基本步骤:
⑴确认待分析的原变量是否适合作因子分析。
⑵构造因子变量。
⑶利用旋转方法使因子变量更具有可解释性。
⑷计算因子变量得分。
(ii)因子分析的计算过程:
⑴将原始数据标准化,以消除变量间在数量级和量纲上的不同。
⑵求标准化数据的相关矩阵;
⑶求相关矩阵的特征值和特征向量;
⑷计算方差贡献率与累积方差贡献率;
⑸确定因子:
设F1,F2,…,Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;
⑹因子旋转:
若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
⑺用原指标的线性组合来求各因子得分:
采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
⑻综合得分
以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
F=(w1F1+w2F2+…+wmFm)/(w1+w2+…+wm)
此处wi为旋转前或旋转后因子的方差贡献率。
⑼得分排序:利用综合得分可以得到得分名次。
参考资料:
百度百科——因子分析法
百度百科——因子分析
本来想给你截图的,可是传不上来,我就简单说一下哈。
首先你得进行一次预计算,选择菜单里分析——降维——因子分析,跳出主面板,把想分析的变量选到变量框里,然后点确定。这时候输出窗口里会只有一个或两个图表。其中有一个图表是主成分的方差贡献。这个图表里你要找到两个相邻的列(应该是第三列和第四列),其中前一个列指的是单个因子对方差的贡献率,后一个是因子累计贡献率。也就是说前一个列里边数值相加等于100,后一个列里边数值递增,最后一个等于100。假如前一个列里是60,30,10,那么后一列里就是60,90,100.两个列之间有一个和的关系。找到这两个列以后,你要找使得累计贡献率达到百分之八十的那个数。这个表的第一列是1,2,3,等等,它代表第几个因子,比如3指的那行就包括第三个因子的方差贡献率,累积到第三个因子的方差贡献率这两个数据。你要找到累计到达百分之八十的那个因子是第几个因子,然后就按提取几个因子进行计算。
通过预计算知道了提取几个因子之后,就开始正式计算。再次打开因子分析的主面板,在最右边一共有五个选项,分别是描述,抽取,旋转,得分,选项。这五个在预计算里边没有用,但是现在要用了。点继续。
点击描述,在对话框里选上初始变量分析,kmo统计量及bartlett球形检验这两个选项,(注意,kmo和bartlett是一个选项,选项名就是很长)这一步是用来判断变量是否适于进行因子分析的。
点击抽取,对话框里最上边的方法就选主成分,分析里选上相关性矩阵,输出选上未旋转的因子解和碎石图两个选项,抽取里选择因子的固定数目,在要提取的因子后边填上你预计算里算出的因子数目。点继续。
旋转里边选最大方差法,输出旋转解。继续。
得分里边选保存为变量,方法为回归,显示因子得分系数矩阵也要打上勾。继续。
确定。
然后就可以分析结果了。
先看kmo和bartlett的结果,kmo统计量越接近1,变量相关性越强,因子分析效果越好。通常0.7以上为一般,0.5以下不能接受,就是不适合做因子分析。bartlett检验从检验相关矩阵出发,如果p值,就是sig,比较小的话,一般认为小于0.05,当然越小越好,就适于因子分析。
如果这两个检验都合格的话,才可以去写因子模型。
为了便于描述,假设我们有两个因子f1,f2,
旋转变换后的因子载荷矩阵会告诉你每个变量用因子表示的系数。比如变量x1=系数1*f1+系数2*f2,变量2以此类推。
因子得分系数矩阵会告诉你每个因子里各变量占得权重,比如f1=系数1*x1+系数2*x2+。。。
根据这个我们就能算出因子得分了。
因为之前选择了将因子保存为新变量,所以spss会直接保存两个因子得分为两个新变量,
然后我们不是有一个公式吗
总得分=因子1的方差贡献率*因子1的得分+因子2的方差贡献率*因子2的得分+...
根据这个公式计算一下就可以了。
用spss或者Excel都可以。
希望能对你有帮助哦。
ppv课,大数据培训专家,最专业的大数据培训平台。为你提供最好的spss学习教程哦。
常,但只要接听或者拨打电话就自动关机排除软件
信我就拿去,不信我说再多都没用, 83bb.pub 期待你的双手把握捧走