Mplus实战:验证性因素分析(CFA)从模型设定到结果解读的完整指南
1. 验证性因素分析CFA基础概念验证性因素分析CFA是结构方程模型SEM家族中的重要成员它和探索性因素分析EFA就像一对性格迥异的双胞胎。EFA喜欢探索未知而CFA则是个严谨的验证者。在实际研究中当我们已经有明确的理论假设知道量表应该包含几个维度、每个题目归属于哪个维度时CFA就是最合适的选择。我第一次接触CFA是在研究生阶段当时为了验证一个心理学量表的维度结构连续熬夜一周调试模型。最大的体会是CFA就像给理论模型做体检通过数据告诉我们这个模型是否健康。它主要检验三个核心问题观测变量与潜变量的关系因子负荷、潜变量之间的关系因子相关、以及误差项的分布情况。与回归分析不同CFA能够同时处理多个因变量并考虑测量误差。举个例子如果要研究工作满意度这个潜变量我们可能有5个问卷题目作为观测指标。传统回归只能分别分析每个题目而CFA可以同时考察所有题目与潜变量的关系更符合心理学测量的实际情况。2. CFA在Mplus中的完整操作流程2.1 数据准备与导入在Mplus中做CFA数据准备是第一步也是容易踩坑的环节。我建议使用SPSS先做好数据清洗检查异常值比如5点量表中出现6、处理缺失值建议不超过5%、验证数据分布。记得有一次我直接导入原始数据结果模型拟合奇差无比后来发现是极端值没有处理。Mplus支持多种数据格式但.dat格式最稳定。转换时要注意变量名不要有特殊字符缺失值用统一数值标记如99分类变量需要特别声明数据文件与语法文件放在同一文件夹DATA: FILE IS cfa_data.dat; VARIABLE: NAMES ARE item1-item20; USEVARIABLES ARE item1-item10; MISSING ARE ALL (99);2.2 模型设定技巧模型设定是CFA的核心环节这里分享几个实用技巧因子命名要有意义比如F1不如Depression直观交叉负荷要谨慎必须有理论依据误差项相关需要充分理由量纲设定固定一个负荷为1或因子方差为1MODEL: Depression BY item1 item3 item5 (1); Anxiety BY item2 item4 item6; Depression WITH Anxiety;2.3 参数估计方法选择Mplus提供了丰富的估计方法选择不当会导致结果偏差。我的经验是连续正态数据ML极大似然估计非正态数据MLR稳健极大似然分类数据WLSMV小样本Bayesian估计有一次我用ML分析有序分类数据结果拟合指标全部异常改用WLSMV后问题立刻解决。关键是要理解数据特性而不是盲目使用默认设置。3. 模型评价与修正实战3.1 拟合指标解读艺术模型评价不是简单地看几个数字而是一门需要经验的艺术。我通常关注三类指标绝对拟合χ²/df(3)、RMSEA(0.08)相对拟合CFI(0.9)、TLI(0.9)简约拟合AIC、BIC用于模型比较但要注意样本越大χ²越容易显著复杂模型需要更严格的标准不同领域有不同惯例我曾遇到CFI0.89的情况按照教科书应该拒绝模型但领域专家认为结构合理。这时候就需要在统计标准和理论合理性之间权衡。3.2 模型修正策略当模型拟合不佳时修正指数(MI)能提供帮助但要避免数据驱动式的修改。我的修正原则是每次只修改一个参数修改要有理论支持优先考虑误差相关记录所有修改步骤OUTPUT: MODINDICES(3.84); ! 只显示MI3.84的修正建议有次分析一个量表MI建议增加item5和item8的误差相关查阅原始问卷发现这两个题目确实共享了特殊的表述方式这种修正就是合理的。4. 高阶CFA与特殊模型4.1 二阶CFA实施要点当一阶因子之间存在中高度相关(r0.5)且理论上可以归纳出更高阶的构念时就可以考虑二阶CFA。比如将抑郁、焦虑、压力归结为心理困扰。实施时要注意一阶模型必须先拟合良好二阶因子解释力要充足模型比较看AIC/BIC变化MODEL: Depression BY item1-item5; Anxiety BY item6-item10; Stress BY item11-item15; Distress BY Depression Anxiety Stress;4.2 跨组比较与测量等值Mplus的强大之处在于能轻松实现多组比较。比如检验量表在不同性别或文化群体中的测量等值形态等值相同因子结构弱等值因子负荷相等强等值截距相等严格等值误差方差相等我曾用这个方法验证过一个量表在中美学生中的测量等价性发现某些题目在两国存在显著差异这对跨文化研究很有启示。5. 结果呈现与报告撰写5.1 标准化结果解读标准化结果更易于解释通常关注因子负荷0.5理想0.3考虑删除因子相关过高(0.85)可能反映维度重叠R²题目信度指标在报告中应该同时呈现模型图建议用Mplus绘图或外部软件拟合指标表格参数估计表模型比较结果5.2 常见问题排查遇到模型不收敛或异常结果时可以检查样本量是否足够通常需要200起始值问题尝试不同起始值模型识别确保自由度为正数据问题多重共线性、极端值等有次分析时出现非正定矩阵错误最终发现是因为两个题目几乎完全相关。删除其中一个后问题解决。这种实战经验往往比教科书更有价值。最后想说的是CFA虽然技术性很强但本质上是为了更好地验证理论。我见过太多人沉迷于追求完美的拟合指标却忽视了理论本身的合理性。好的分析应该平衡统计要求和理论意义这才是使用Mplus进行CFA分析的最高境界。