当前位置:网站首页 > 探索 > 数据分析:因子分析常见的6大问题汇总

数据分析:因子分析常见的6大问题汇总

数据分析:因子分析常见的6大问题汇总后台回复1免费送你《产品经理入门资料包》因子分析法是指从研究指标相关矩阵内部的依赖关系出发

探索性因子分析_探索性因子分析_探索性因子分析

后台回复1免费送你《产品经理入门资料包》

因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。

是一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法。

基本思想

根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构一即公共因子。

为什么做因子分析

举例说明:在实际门店问题中,往往我们会选择潜力最大的门店作为领航店,以此为样板,实现业绩和利润的突破及未来新店的标杆。选择领航店过程中我们要注重很多因素,比如:

↘所在小区的房价

↘总面积

↘户主年龄分布

↘小区户数

↘门店面积

↘2公里范围内竞争门店数量等

收集到所有的这些数据虽然能够全面、精准的确定领航店的入选标准,但实际建模时这些变量未必能够发挥出预期的作用。主要体现两方面:计算量的问题;变量间的相关性问题。

这时,最简单直接的方案就是削减变量个数,确定主要变量,因子分析以最少的信息丢失为前提,将众多的原有变量综合成少数的综合指标。

全文见:16种常用的数据分析方法-因子分析

在进行因子分析时,总是会遇到各种各样的问题,常见的因子分析疑问包括:

1. 因子分析与主成分分析的区别是什么?

关于这个问题,见诸各大论坛、博客,还有百度知道等栏目,这里引用期刊论文中的文字加以说明。

主成分分析:是研究如何通过少数几个主成分来解释多变量的方差一协方差结构的分析方法,也就是求出少数几个主成分(变量),使它们尽可能多地保留原始变量的信息,且彼此不相关。

它是一种数学变换的方法,即把给定的一组变量通过线性变换,转换为一组不相关的变量(两两相关系数为0,或样本向量彼此相互垂直的随机变量)。

在这种变换中,保持变量的总方差(方差之和)不变。同时具有最大方差,称为第一主成分;具有次大方差,称为第二主成分。在主成分分析中,最终确定成分是原始变量的线性组合。每个主成分都是由原有p个变量线性组合得到。在诸多主成分Z i中,Z 1在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。

因子分析:因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。

每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。通过因子分析得来的新变量是对每个原始变量进行内部剖析。

因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。

探索性因子分析_探索性因子分析_探索性因子分析

总结:

1、主成分分析在于对原始变量的线性变换,注意是转换、变换;而因子分析在于对原始变量的剖析,注意是剖析,是分解,分解为公共因子和特殊因子。

2、这两种分析法得出的新变量,也就是成分或者因子,并不是原始变量筛选或者提出后剩余的变量。

3、因子分析只能解释部分变异(指公共因子),主成分分析能解释所有变异(如果提取了所有成分)。

4、主成分分析,有几个变量就至少有几个成分,一般只提取能解释80%以上的成分;因子分析,有几个变量不一定有几个公共因子,因为这里的因子是公因子,潜在的存在与每一个变量中,需要从每一个变量中去分解,无法解释的部分是特殊因子。

5、spss因子分析过程对各变量间量纲和单位造成的影响,默认自动进行标准化处理,因此不必要在开始之前单独进行数据标准化处理,因为,标准化与否结果一致。

6、spss因子分析重要结果:KMO值,此值是否进行计算与变量个数、样本个数有关,不一定会在每次执行中都显示,如没有此结果,可通过调整变量和样本的比例实现。

2、提取因子个数如何选?

提取因子的个数是一个综合选择的过程。默认是按特征根大于1作为因子提取的标准。

探索性因子分析_探索性因子分析_探索性因子分析

特征根不是唯一的判断标准。除此特征根,还可以通过累积方差贡献率、碎石图等指标综合判断。

如果分析前已经有了预期的维度(因子)划分,也可以在分析时主动设定提取因子个数,再根据上面的指标进行调整。

探索性因子分析_探索性因子分析_探索性因子分析

3. 因子分析可以提供的重要结果是什么?

4. 因子相关矩阵在哪里分析?

使用【通用方法】–【相关】可得到相关矩阵。

探索性因子分析_探索性因子分析_探索性因子分析

5. 出现奇异矩阵如何解决?

如果提示出现奇异矩阵,通常情况下有以下三个原因及解决办法。

第一、由于分析样本量太少(比如分析项有20个,分析样本仅10个),此里需要加大样本量或者减少分析项即可;

第二、分析项之间的相关性非常非常强(相关系数大于0.8,甚至接近1),共线性严重,建议使用相关分析,然后把相关系数值非常大的项移除出去后再次分析;

第三、分析项之间的相关性非常非常弱(相关系数接近0),建议使用相关分析,然后把相关系数值非常小的项移除出去后再次分析。

6. 探索性因子分析与验证性因子分析的区别

二者的区别在于,验证性因子分析(CFA)用于验证对应关系,探索性因子分析(EFA)用于探索因子与测量项之间的对应关系。

如果是成熟的量表,研究者可同时使用验证性因子分析CFA,和探索性因子分析(简称因子分析,EFA)用于验证量表的效度。

如果量表的权威性较弱,通常使用探索性因子分析(EFA)进行探索因子,或者效度检验分析。

上一篇: 传播研究方法大总结(内附内容分析法操作范例)
下一篇: 探索性因子分析和验证性因子分析的区别有哪些?

为您推荐

发表评论