2. 斜交转轴 与直交转轴相反,斜交转轴允许因子间具有相关性。不像直交转轴,在斜交转轴中不存在某种占主导地位的方法。几种斜交旋转方法均被经常使用,而且均可以得到令人满意的结果。这些方法包括直接Oblimin方法(Direct Oblimin) , Promax方法(Promax)等。由于在现实世界中各公共因子之间完全没有相关的可能性极小,因而一些研究者认为采用斜交转轴方法萃取公共因子效果可能更好。Nunnally和Bernstein(1994)认为可以利用成份相关矩阵来判断应该选择直交转轴还是斜交转轴,当各因子间的相关系数大于.30时,最好采用斜交转轴,如果因子间的相关系数小于.30时,则可采取直交转轴法。 (五)因子载荷选取指标准则 一些学者从个别共同因子可以解释题项变量的差异程度,提出因子载荷选取的指标准则。一般而言,因子载荷越大,变量能测量到的公共因子特质越多,因而选取的因子载荷越大,因子结构越佳。但是,如果选取的载荷阀值过高,可能又会低估公共因子的数量。Comrey和Lee (1992)指出,因子载荷大于0.71时,公共因子可以解释指标变量50%的方差,此时的因子载荷属于理想状况;但如果因子载荷小于.32,则公共因子可以解释指标变量的方差不到10%,此时因子载荷状况极不理想,测量题项变量无法有效反映其公共因子。
也就是说,只有载荷达.32和以上的变量才可以被解释。 舍弃 10% .32 不好(poor) 10% .32 普通(fair) 20% .45 好(good) 30% .55 非常好(verg good) 40% .63 理想(excellent) 50% .71 题项变量状况 因子载荷2(解释方差) 因子载荷 资料来源:Comrey和Lee (1992) 表4 因子载荷选取指标准则从理论上说,必须删除因子载荷在.32以下的题项。但在实际操作中,不同研究者在决定因子载荷的阀值时会有不同的偏好。如一些学者倾向于挑选因子载荷0.6以上的题项组成公共因子(如Pizam等,1978);另一些学者则舍弃因子载荷在0.5以下的题项(如宋秋,2008;陈楠和乔光辉,2010;)或0.4以下的题项(如Ap和Crompton,1998;罗艳菊等,2007;黄宇等,2011)。台湾学者吴明隆(2010)认为:“在因素分析程序中,因素负荷量的挑选准则最好在0.4以上,此时共同因素解释题项变量的百分比为16%”。一般而言,当因子结构较佳时,可以考虑取较高的阀值,而当因子结构较差时,就要考虑取较低的阀值。 四、因子分析的操作程序依据SPSS软件所提供的因子分析方法,其操作程序包括5个模块。
(一)描述统计(Descriptives) 在“因子分析”分析对话窗口中,单击“描述(D)…”按钮,系统弹出“因子分析:描述统计”(Factor Analysis: Descriptives)对话框,如下图所示。 1. 统计量(Statistics)框 (1)单变量描述性(Univariate descriptives)复选框:输出各个题项的变量名称、平均数、标准差与有效观察值个数。 (2)原始分析结果(Initial solution)复选框:输出因子分析未转轴前的共同性、特征值、个别因子解释的方差百分比及所有公共因子累计解释百分比。 2. 相关矩阵(Correlation Matrix)框 (1)系数(Coefficients)复选框:输出题项变量间的相关系数矩阵。 (2)显著性水平(Significance levels)复选框:输出相关系数矩阵的显著性水平。 (3)行列式(Determinant)复选框:输出相关系数矩阵的行列式值。 (4)KMO和Barlett的球形检验(KMO and Barlett’s test of Sphericity)复选框:输出KMO抽样适当性参数与Bartlett球形检验结果。
(5)逆模型(Inverse)复选框:输出相关系数矩阵的逆矩阵。 (6)再生(Reproduced)复选框:输出再生相关阵,上三角形矩阵代表残差值,而主对角线及下三角形代表相关系数。 (7)反映像(Anti-image)复选框:输出反映像共变量及相关矩阵,反映像相关矩阵的对角线数值代表每一个变量的取样适当性量数(MSA)。 (二)因子抽取(Extraction) 在“因子分析” 对话窗口中,单击“抽取(E)…”按钮,系统弹出“因子分析:抽取” (Factor Analysis: Extraction)对话框,如下图所示。 1.方法(Method)下拉框 从方法下拉框可选择公共因子抽取方法。共包含7种公共因子抽取方法:主成分法(Principle components)、未加权的最小平方法(Unweighted least squares)、综合最小平方法(Generalized least squares)、最大似然(Maximum likelihood)、主轴因子分解(Principle axis factoring)、α因子分解(Alpha factoring)、映像因子分解(Image factoring)。
2. 分析(Analyze)框 (1)相关性矩阵(Correlation matrix)复选框:以相关矩阵来萃取因子,选择此项才能输出标准化处理后的特征值,适用于参与分析的变量测度单位不同的情况。相关矩阵的对角线为变量与变量自身的相关系数,其数值为1。 (2)协方差矩阵(Covariance matrix)复选框:以协方差矩阵来萃取因子,适用于参与分析的变量测度单位相同的情况。协方差矩阵的对角线为变量的方差。 3. 输出(Display)框 (1)未旋转的因子解(Unrotated factor solution)复选框:输出未经旋转的因子萃取结果。 (2)碎石图(Scree Plot)复选框:输出以特征值大小排列的因子序号为横轴,以对应的特征值为纵轴绘制的碎石图。碎石图有助于判别公共因子保留的数目。 4. 抽取(Extract)框 (1)基于特征值:特征值大于(Eigenvalues over)单选框:该项根据特征值大小来确定公共因子的萃取,系统默认取值为1,表示要求萃取那些特征值大于1的公共因子。由于此值为系统默认,使用者一般不要随意更改,使用者若要另设特征值指标,必须要有相关的理论或文献支持,或要经验法则支持。
(2)因子的固定数量:要提取的因子(Number of factors)单选框:选取该项时,可以在后面的空格中输入限定的因子个数。理论上有多少个分析变量就有多少个因子,如果不知道该萃取多少个因子,也可以先输入所有因子,再根据输出结果中各公共因子的特征值、累计方差百分比、以及自己的需要等确定萃取多少个因子。 5. 最大收敛性迭代次数(Maximum Iterations for Convergence)框此项可指定因子分析收敛的最大迭代次数。系统默认的最大迭代次数为25,一般在进行因子分析时,此数值通常不用更改。但当数据量较大时,25次迭代可能不够,此时可以将之改为50次、100次甚至更多。 (三)因子旋转(Rotation) 在“因子分析”对话窗口,单击“旋转(R)…”按钮,系统弹出“因子分析:旋转”(Factor Analysis: Rotation)对话框,如下图所示。 1方法(Method)框 共有6种方法供使用者选择。 (1)无(None)单选框:此项表示不需要进行转轴。 (2)最大方差法(Varimax)单选框:方差最大旋转属于正交旋转,能够使每个因子上具有最高载荷的变量数最小。
(3)直接Oblimin方法(Direct Oblimin)单选框:属斜交转轴方法之一。选择此法时,需要在其下方“Delta”中键入一个小于或等于0.80的数值。当Delta值取负数,且其绝对值越大时,表示因子间的斜交情形越不明显,Delta的数值越接近0.80,表示因子间的相关越高。系统默认的“Delta”值为0。 (4)最大四次方值法(Quartimax)单选框:属于正交转轴法之一。 (5)最大平衡值法(Equamax)单选框:属于正交转轴法之一。是Varmax方法和Quartimax方法的结合,可使在一个因子上有高载荷的变量数和变量中需要解释的因子数最少。 (6)Promax(Promax)单选框:又称最优转轴法,是斜交转轴法之一。选择此项时,需要在其下方的编辑框中键入Kappa值。其值应大于1,系统默认值为4,表示因子负荷量取4次方以产生接近0但不为0的值,以估算出因子间的相关并简化因子。 2. 输出(Display)框 (1)旋转解(Rotated solution)复选框:输出因子旋转结果。正交旋转输出因子组型(pattern)矩阵及因子转换矩阵;斜交旋转输出因子组型矩阵、因子结构矩阵与因子相关矩阵。
(2)载荷图(Loading plot(s))复选框:输出经旋转后的因子载荷散点图。因子散点图可以显示题项变量与公共因子间的关系,若萃取的公共因子达三个以上,则会输出前三个公共因子的3D立体图;如果只萃取两个公共因子,则输出2D平面图。 3. 最大收敛性迭代次数(Maximum Iteration for convergence)框 指定转轴时执行的最大迭代次数,系统默认值为25,如果题项变量较多,无法进行默认的收敛最大迭代25次因子转轴时,可以将数值改大,如50或100。 * *一、基本概念二、基本原理三、EFA分析的几个关键问题四、EFA分析的操作程序五、实际调查案例剖析 一、基本概念因子分析(factor analysis),也称因素分析,可分为探索性因子分析(Exploratory Factor Analysis,EFA)和验证性因子分析(Confirmatory Factor Analysis,CFA)两种。在旅游研究领域,有许多涉及心理学方面的抽象概念,如游客的动机和满意度、景区所在地居民对旅游影响的感知等均很难用单一指标来表述,通常研究者们会通过构建繁杂的指标体系来进行测量。
如何将上述繁杂的指标体系缩减为较少数量具有代表性意义的公共评价因子,就需要借助探索性因子分析方法。表1 美国马萨诸塞州科德角游客满意度评价指标 宾馆/汽车旅馆的服务质量 (Quality of service in hotels/motels) 16 当地居民的一般友好程度 (General friendliness of the people in the area) 15 公路方向标志的充足性 (Adequacy of directional signs on highways) 14 海滩上设施的质量 (Quality of facilities at beaches) 13 度假区的易达性 (Ease of access to the resort area) 12 居民对游客的礼貌 (Courtesy of residents towards the tourists) 11 居民对游客的接待 (General hospitality of residents towards tourists) 10 居民帮助游客的意愿 (Willingness of residents to aid tourists) 9 露营地设施的质量 (Quality of facilities at campgrounds) 8 拥有海滩停车场所 (Availability of parking spaces for the beaches) 7 拥有露营地 (Availability of campgrounds) 6 服务和商品价格收费的公平性 (Fairness of the services and goods for the price charges) 5 度假的费用 (Cost of vacationing) 4 一般商品和服务的费用 (Cost of general goods and services) 3 商业化程度 (Extent of commercialization) 2 度假区的交通条件 (Traffic condition in resort area) 1变量(Variable) 序号 风景与自然景观 (Scenery and natural attraction) 32 餐馆、咖啡厅和酒吧的拥有 (Availability of restaurants, cafeterias and bars) 31 拥有海滩 (Availability of beaches) 30 环境质量 (Quality of the environment) 29 宾馆/汽车旅馆的拥有 (Availability of hotels/motels) 28 旅游信息的充分性 (Adequacy of tourism information) 27 天气条件 (Weather conditions) 26 饮食场所的质量 (Quality of eating and drinking places) 25 海滩区域的清洁程度 (Cleanliness of the beach area) 24 购物设施的拥有及其质量 (Availability and quality of shopping facilities) 23 饮食场所的服务质量 (Quality of service in eating and drinking places) 22 宾馆/汽车旅馆提供设施的质量 (Quality of facilities offered at hotels/motels) 21 旅游设施的员工帮助游客的意愿 (Willingness of the employees of tourist facilities to aid tourists) 20 海滩上的可用空间 (Availability of space on the beach) 19 旅游设施的员工对游客的礼貌 (Courtesy of employees of tourist facilities towards tourists) 18 旅游设施员工的一般友好程度 (General friendliness of the employees of tourist facilities) 17 资料来源:Pizam, Neumann, and Reichel(1978).探索性因子分析的目的在于找出量表的潜在结构,减少题项的数目,使之变为一组较少而彼此相关较大的变量。
因而探索性因子分析是一种资料推导的分析。如果一个量表层面及所包含的题项已非常明确,使用者为再确认该量表各层面及所包含的题项是否如原先使用者所预期的,需要采用一定的方法加以验证,以探究量表的因素结构是否能与抽样样本适配,此种因子分析称为验证性因子分析。因而验证性因子分析是一种理论推导的分析。目前探索性因子分析方法在旅游研究领域的应用相对较广,因而这里仅讨论探索性因子分析。 二、基本原理 (一) 潜在变量模型与基本原则 因子分析所得到的潜在变量,就是社会科学中所谓的抽象构念,因而因子模型又被称为潜在变量模型(latent variable model)。因子分析是一种潜在结构分析法,其假定每个变量(在量表中称为题项)均由两个部分所构成,一为公共因子(common factor),一为独特因子(unique factor)。公共因子的数目会比指标(原始题项)数少,而每个指标皆有一个独特因子,如果一个量表共有n个题项数,则也会有n个独特因子。独特因子有两个假定: (1)所有的独特因子间互不相关; (2)所有的独特因子与所有的公共因子间也不相关。 而公共因子间则可能彼此相关,也可能不存在相关。
如在直交转轴状态下,所有的公共因子间彼此没有相关;而在斜交转轴的情况下,所有的公共因子彼此间就有相关。潜在变量的一个重要统计原则是局部独立性原则(principal of local independence)。如果一组观察变量背后确实存在潜在变量,当统计模型正确确定了潜在变量后,各观察变量之间所具有的相关就会消失,即具有统计独立性。如果观察变量的剩余方差中仍带有相关,那么局部独立性即不成立,此时因子分析所得到的结果并不适切。因子分析对于潜在变量的定义与估计,有一个重要的方法学原则,称为简约原则(principle of parsimony)。简约有结构简约和模型简约双重涵义,前者指观察变量与潜在变量之间具有最简化的结构特性,后者指最简单的模型应被视为最佳模型。测验所得的最佳化因子结构,称之为简化结构(simple structure),是因子分析的最重要的基本原则。 (二) 因子与共变结构 因子分析所处理的材料是观察变量之间的共变,亦即利用数学原理来抽离一组观察变量之间的公共变异成分,然后利用这个公共变异成分来反推这些变量与此一公共部分的关系。如有一组观察变量,以X表示,第i与第j个观察变量间具有相关 ,从因子分析模型的观点来看, 系指两者的公共部分,此一公共部分可以系数和(因子载荷量factor loading)来表示,于是有以三个观察变量(、 、 )为例,在两两之间具有相关的情况下,可以计算出三个相关系数(、 、),如图(a)所示。
这三个观察变量的公共变异部分,可以F来表示,其与三个观察变量的关系可以图(b)表示(a) 相关模型(b) 潜在变量模型三个相关系数可以、 、表示,亦即、、。在不同的数学算则与限定条件下,可以求得前述方程中、、的、、三个系数的最佳解,此即因子分析所得到的参数估计结果。估计得出的共同部分F则称为公因子(common factor),此因子模式建立后,研究者即可利用F的估计分数来代表观察变量,达到资料简化的目的。 (三) 因子分析方程式 因子分析的一般数学模型可以表达为:式中, 代表第j个变量的标准化分数; 为第i个公共因子;m为所有变量公共因子的数目; 为变量的特殊因子; 为因子载荷量(factor loading),表示第i个公共因子对第j个变量的方差贡献。 (四)几个重要指标的计算在因子分析中,涉及几个重要指标的计算:共同性、特征值和解释量。这里以三个变量抽取两个公共因子为例,三个变量的线性组合为: 解释量 特征值 V3 V2 V1 特殊因子U 共同性C F2(公共因子二) F1(公共因子一) 变量 表2 共同性、特征值与解释量的计算 三、因子分析的几个关键问题 (一)使用因子分析的可能性并非所有的多变量数据均适合采用因子分析方法。SPSS软件提供4个统计量来判断观测数据是否适合进行因子分析。 1. KMO检验(Kaiser-Meyer-Olkin Measure of Sampling Ad
发表评论