-本页仅作为文档封面,使用时请直接删除即可--内页可以根据需求调整合适字体及大小-什么是探索性因子分析法探索性因子分析法(ExploratoryFactorAnalysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将具有错综复杂关系的变量综合为少数几个核心因子。探索性因子分析法的起源因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析》英国的心理学CharlesSpearman在1904年的时候,提出单一化的智能因子(ASingleIntellectualFactor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(MultipleFactorAnalysis)理论。Thurstone在他的《心智向量》(VectorsMind,1935)—书中,阐述了多元因子分析理论的数学和逻辑基础。[编辑]探索性因子分析和验证性因子分析的异同探索性因子分析和验证性因子分析相同之处两种因子分析都是以普通因子分析模型作为理论基础,其主要目的都是浓缩数据.通过对诸多变量的相关性研究,可以用假想的少数几个变量(因子、潜变量)来表示原来变量(观测变量)的主要信息。
图1所示即为最简单、也最为常见的因子模型,每个观测变量(指标)只在一个因子(潜变量)上负荷不为零,X、弟、匕是潜变量右的指标,尢、%是潜变量&的指标。所示的因子模型推广至一般意义上的因子模型后,各观测变量xJ与m个公共因子&&•••,&之间的关系可以用数学模型表示如下:其中:X为各观测变量;是公共因子;6是x,的特殊因子,有时也称误差项,包括x唯一性因子和误差因子两部分;入是公共因子的负载;m是公共因子&&,…,&的个数,k测变量乩…K的个数,mk上式也可以简单地用矩阵表示如下:x二代E…入用叫是负载矩阵探索性因子分析和验证性因子分析的差异之处基本思想不同因子分析的基本思想是要寻找公共因子,以达到隆维的目的。探索性因子分析主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,以试图揭示一套相对比较大的变量的内在结构。研究者的假定是每个指标变量都与某个因子匹配,而且只能通过因子载荷凭知觉推断数据的因子结构。而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力,以试图检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预期一致。指标变量是基于先验理论选出的,而因子分析是用来看它们是否如预期的—样。
其先验假设是每个因子都与一个具体的指示变量子集对应,并且至少要求预先假设模型中因子的数目,但有时也预期哪些变量依赖哪个因子。应用前提不同探索性因子分析没有先验信息,而验证性因子分析有先验信息。探索性因子分析是在事先不知道影响因子的基础上,完全依据样本数据,利用统计软件以一定的原则进行因子分析,最后得出因子的过程。在进行探索性因子分析之前,不必知道要用几个因子,以及各因子和观测变量之间的关系。在进行探索性因子分析时,由于没有先验理论,只能通过因子载荷凭知觉推断数据的因子结构。上述数学模型中的公共因子数m在分析前并未确定,而是在分析过程中视中间结果而决定,各个公共因子统一地规定为均影响每个观测变量总在管理研究中,如仅仅从数据出发,很难得到科学的结果,甚至可能与已有的理论或经验相悖。因此,探索性因子分析更适合于在没有理论支持的情况下对数据的试探性分析。这就需要用脸证性因子分析来做进一步检验。而验证性因子分析则是基于预先建立的理论,要求事先假设因子结构,其先验假设是每个因子都与一个具体的指示变量子集对应,以检验这种结构是否与观测数据一致。也就是在上述数学模型中,首先要根据先验信息判定公共因子数m,同时还要根据实际情况将模型中某些参数设定为某一定值。
这样,验证性因子分析也就充分利用了先脸信息,在已知因子的情况下理论假设不同探索性因子分析的假设主要包括:(3〕所有的公共因子都相关(或都不相关);2所有的公共因子都直接影响所有的观测变量;特殊(唯一性)因子之间相互独立;所有观测变量只受一个特殊(唯一性)因子的影响;公共因子与特殊因子(唯一性)相互独立。验证性因子分析克服了探索性因子分析假设条件约束太强的缺陷,其假设主要包括:公共因子之间可以相关,也可以无关;观测变量可以只受一个或几个公共因子的影响,而不必受所有公共因子的影响;特殊因子之间可以相关,还可以出现不存在误差因素的观测变量;公共因子与特殊因子之间相互独立。分析步骤不同探索性因子分析主要有以下七个步骤:收集观测变量:通常采用抽样的方法,按照实际情况收集观测变量数据。2构造相关矩阵:根据相关矩阵可以确定是否适合进行因子分析。3确定因子个数:可根据实际情况事先假定因子个数,也可以按照特征根大于1的准则或碎石准则来确定因子个数。,提取因子:可以根据需要选择合适的因子提取方法,如主成分方法、加权杲小平方法、极大似然法等。因子旋转:由于初始因子综合性太强,难以找出实际意义,因此一般都需要对因子进行旋转(常用的旋转方法有正交旋转、斜交旋转等),以便于对因子结构进行合理解释::6解释因子结构:可以根据实际情况及负载大小对因子进行具体解释。
7算因子得分:可以利用公共因子来做进一步的研究,如聚类分析、评价等::而验证性因子分析主要有以下六个步骤:定义因子模型:包括选择因子个数和定义因子载荷。因子载荷可以事先定为0、或者其它自由变化的常数,或者在一定的约束条件下变化的数(比如与另一载荷相等)。收集观测值:根据研究目的收集观测值。获得相关系数矩阵:根据原始资料数据获得变量协方差阵。4拟合模型:这里需要选择一种方法(如极大似然估计、渐进分布自由估计等)来估计自由变化的因子载荷。评价模型:当因子模型能够拟合数据时,因子载荷的选择要使模型暗含的相关矩阵与实际观测矩阵之间的差异杲小。常用的统计参数有:卡方拟合指数(力、比较拟合指数(CFI)、拟合优度指数(GFI)和估计误差均方根(RMSEA)根据Bentler(1990)的建议标准,K/DFW、CF&、GFim、RMSEW,则表明该模型的拟合程度是可接受的。〔6修正模型:如果模型拟合效果不佳,应根据理论分析修正或重新限定约束关系,对模型进行修正,以得到最优模型。主要应用范国不同探索性因子分析主要应用于三个方面:寻求基本结构,解决多元统计分析中的变量间强相关问题;数据化简;发展测量量表n验证性因子分析允许研究者将观察变量依据理论或先前假设构成测量模式,然后评价此因子结构和该理论界定的样本资料间符合的程度。
因此,主要应用于以下三个方面:S验证量表的维度或面向性(dimensionality),或者称因子结构,决定最有效因子结构;验证因子的阶层关 系;评估量表的信度和效度。 探索性因子分析和验证性因子分析的正确用法从上述分析可以看出,探索性因子分析和验证性因子分析是因子分析的两个不可分割的重 要组成部 分,在管理研究的实际应用中,两者不能截然分开,只有结合运用,才能相得益彰, 使研究更有深度; An-derson, W建议,在发展理论的过程中,首先应通过探索性因子分析建立模型, 再用验证提供了发析现模型以验证和修正的概念和计算工具,其 提供的结果为验证性因子分析建立假设 提供了重要的基础和保证。两种因子分析缺少任何一 个,因子分析都将是不完整的。一股来说,如果研 究者没有坚实的理论基础支撑,有关观测变 量内部结构一般先用探索性因子分析,产生一个关于内部结 构的理论,再在此基础上用验证性 因子分析,这样的做法是比较科学的,但这必须要用两组分开的数据 来做。如果研究者直接把 探索性因子分析的结果放到统一数据的验证性因子分析中,研究者就仅仅是拟 合数据,而不是 检验理论结构。如果样本容量足够大的话,可以将数据样本随机分成两半,合理的做法 就是先 用一半数据做探索性因子分析,然后把分析取得的因子用在剰下的一半数据中做验证性因子分 如果验证性因子分析的拟合效果非常差,那么还必须用探索性因子分析来找出数据与模型之间的不一致。
探索性因子分析法的计算 在运用EFA 法的时候,可以借助统计软件(如SPSS 统计软件或SAS 统计软件)来进行数 据分析。 探索性因子分析法的运用 顾客、产品及行为分类。探索性因子分析法的步骤 一个典型的EFA 流程如下: 获得协方差矩阵(或Bravais-Pearson的相似系数矩阵) 验证将用于EFA的协方差矩阵(显着性水平、反协方差矩阵、Bartlett 球型测验、反图 确定提取因子的个数(以Kaiser准则和Scree 测试作为提取因子数目的准则)。 解释提取的因子(例如,在上述例子中即解释为"潜在因子"和“流程因子”)。探索性因子分析法的优点 EFA法便于操作。 当调查问卷含有很多问题时,EFA法显得非常有用。 EFA法既是其他因子分析工具的基础(如计算因子得分的回归分析),也方便与其他工 具结合 使用(如验证性因子分析法)。 探索性因子分析法的缺点 1、变量必须有区间尺度。 2、沉降数值至少要要变量总量的3 探索性因子分析法的假定对于主因子分析法来说,不存在异常值、等距值、线形值、多变量常态分配以及正交性等 情况。 EFA 在教育、心理领域存在的问题及建议 2•样本容量、观测变量数目不够 很多应用探索性因子分析的研究中,普遍存在的一个问题就是样本容量及观测变量数目太 小。
探索 性因子分析中,一般要求样本容量至少为100-200,当变量的公共方差较大时,则一定数 目的小样本也能 确保因子负载的稳定性。国内学者曾做过一项调查,结果表明1991-2000 年国内 两种心理学期刊发表的 运用因子分析的文童中,有近1 琳的文童研究样本小于100,甚至有多达 酬的文童没有提供这一信息。而对于观测变量的数目,一般认为,观测变量与所提取的因子数目 之比至少为4。很多研究者认为观测变 量的数目并不与被提取的因子数目相关联,因为研究者事 先并不知道会有多少个因子彼提取出来,因此, 无法依据被提取的因子个数对观测变量的数目进行 安排,但是,实际上很多研究者在因子分析前对所探 讨的观测变量的因子结构已有了一定的预期。 教育、心理领域中,存在着相当数量的研究并未达到这些 标准。这或许是由于研究者对因子分析 的要旨理解不深,但更有可能的是研究者对这类方法的细节重视 不够。 因子提取方法的误用探索性因子分析中杲常用的提取因子的方法主要有两种:主成分分析法和主轴因子法。决定 选用何 种方法时,一股有两点值得考虑:一是因子分析的目的;二是对变量方差的了解程度。如果 因子分析的目 的是用最少的因子杲大程度解释原始数据的方差,则应用主成分分析法;若因子分析 的主要目的是确定数
发表评论