中介效应模型:从公式到DMSAS操作,一篇全搞定!
DMSAS
2025-03-14 00:15:00
一、中介效应的定义与核心概念
定义:中介效应模型旨在探究自变量(X)对因变量(Y)的作用机制,特别关注是否存在中间变量(M)在两者之间传递影响。
核心概念:总效应可以拆分为直接效应与间接效应。
案例:“高尿酸血症(X)”通过“肥胖(M)”间接作用于“高血压前期(Y),此时,肥胖扮演了中介变量的角色,其作用路径的统计显著性便构成了中介效应。
模型公式与关系:
1. 总效应模型:( Y = cX + e₁ )(c为X对Y的总效应)
2. 中介路径模型:
① ( M = aX + e₂ )(a为X对M的效应)
② ( Y = c'X + bM + e₃ )(b为M对Y的效应,c'为X对Y的直接效应)
③ 效应分解:总效应 ( c = c' + ab ),其中 ( ab ) 为间接效应(即中介效应)。

模型公式示意图
二、模型检验方法
中介效应的检验需结合统计显著性分析与效应量评估,常用方法包括:
1.逐步检验法(DMSAS中输出)
步骤:
① 检验总效应c是否显著(若不显著可能终止分析,但需注意“遮掩效应”存在的可能);
② 检验路径a(X→M)和路径b(M→Y)的显著性;
③ 判断直接效应c'是否显著,区分完全中介(c'不显著)或部分中介(c'显著)。
局限性:逐步法对弱效应敏感,可能漏检中介效应,且未直接检验ab的显著性。
优势:逻辑清晰简便,适合初学者快速入门。且这种“先总后分”的流程在理论驱动型研究中具有重要价值。
2.Sobel检验
步骤:
① 建立自变量(X)对中介变量(M)的回归模型,得到回归系数 a 及其标准误。
② 建立中介变量(M)对因变量(Y)的回归模型(同时控制X),得到回归系数 b 及其标准误。
③ 计算间接效应及其标准误。
④ 计算Sobel检验统计量 Z,并基于标准正态分布判断显著性(统计量绝对值>1.96为显著)。
局限性:要求 a×b 服从正态分布,但实际中即使 a 和 b 正态,其乘积也可能非正态,导致检验结果偏差。样本量较小时,统计效力降低,易出现假阴性(如间接效应实际存在但未检出)。无法处理复杂模型。不同标准误计算方法可能导致结果不一致,增加误判风险。
优势:无需多次假设检验,直接通过乘积系数 a×b 的显著性评估中介效应,计算简便,适合手动计算或者快速实现,因此在早期的研究中得到广泛应用。
3.Bootstrap法(DMSAS中输出)
步骤:
①从总体中随机抽取一个容量为 n 的样本作为基础数据。
②通过有放回抽样(Resampling),从原始样本中随机抽取 n 个数据点,形成一个新的自助样本。重复此过程 B 次(通常 B≥1000),生成大量自助样本。
③对每个自助样本计算目标统计量(如均值、中位数、方差等),得到 B 个统计量的值。
④根据 B 个统计量值绘制直方图或核密度曲线,形成该统计量的经验分布,用于模拟总体参数的不确定性。
⑤基于经验分布进行参数估计或假设检验。例如,通过取经验分布的2.5%和97.5%分位数作为95%置信区间。
局限性:生成大量自助样本并进行重复计算会消耗大量的计算资源,特别是在处理大规模数据集时。如果原始样本中存在显著的离群值或分布极不均衡,那么使用Bootstrap方法可能会导致结果出现偏差。对于高维数据或非独立同分布的情况(例如时间序列数据),需要采用改进的方法(如Block Bootstrap)才能确保适用性。如果原始样本无法充分代表总体(例如存在抽样偏差),那么得到的结果可能不够准确。
优势:无需假设总体分布形式,适用于未知或非正态分布的数据。在样本量较小的情况下,仍能提供可靠的统计推断,弥补传统方法的不足。可应用于多种统计量(如均值、方差、回归系数等)和复杂模型(如机器学习性能评估)。通过经验分布直接展示统计量的变异性,便于理解。
三、效应解释与注意事项
1.效应量计算
中介比例反映间接效应占总效应的比重。例如,腰围在HUA与高血压关联中的中介比例为7.76%。
2. 负中介效应
若ab与c'符号相反,可能表明遮掩效应。
3.模型假设与验证
- 时序性
X→M→Y需符合时间顺序,避免反向因果(如Y影响M)。
- 无混淆变量
需控制X→Y和M→Y路径中的混杂因素,否则估计偏误。
- 测量误差
中介变量的测量误差会导致b趋零偏误,高估c'。
四、应用场景与实例
1.医学研究
案例:肥胖(M)在HUA(X)与高血压前期(Y)间起中介作用,通过Bootstrap法验证其效应。
2.社会科学
- 教育水平与健康:文化程度(X)通过吸烟(M1)和饮食(M2)间接影响肺癌风险(Y),采用系数乘积法与差异系数法组合分析。
- 欺凌行为研究:遭受欺凌(X)通过家庭关系(M)影响施加欺凌(Y),结构方程模型结合Bootstrap检验。
3.心理学与行为科学
- 完全中介:若工作压力(X)仅通过焦虑(M)影响绩效(Y),则焦虑为完全中介。
- 多重中介:如饮酒对健康的影响可能通过社交(正向)和肝损伤(负向)两条路径同时作用。
五、模型扩展与争议
1、调节效应与中介效应的区分
调节效应指变量(如性别)改变X→Y关系的强度,而中介效应解释作用路径。两者可结合形成有调节的中介模型。
2、方法论争议
- 逐步法的滥用:部分研究过度依赖逐步法,忽视Bootstrap等更稳健的方法。
- 理论驱动不足:中介变量选择需基于理论,而非数据挖掘,否则可能导致伪中介。
六、报告规范
1. 需报告效应量(ab和中介比例)、置信区间、检验方法(如Bootstrap抽样次数)及控制变量。
2. 示例:在护理干预研究中,需说明“自我效能感”的中介效应值为0.119(95%CI: 0.075~0.165)。
七、使用DMSAS完成中介效应分析
1.数据概览
本篇内容涉及移民相关数据(欲获取数据,请在公众号回复:移民数据),数据量庞大,让我们聚焦于几组我们特别关注的数据。
注意:二分类变量,也是结局变量 。
![]() |

2.分析目标
探讨治疗是否能够改善焦虑状况,并因此影响患者的移民决定。
3.操作流程
Step1:选择分析方法
在导入数据后,点击“分析”,点击“中介效应模型”。
Step2:选择变量
进入中介效应模型的界面后,将 cong_mesgy移动到因变量,将treat移动到自变量,将emo移动到中介变量。
Step3:调整模型
将总效应模型调整为binomial。
在以上步骤都完成后,点击“确定”,就可以让DMSAS运行中介效应模型了。

4.结果分析
在完成上述步骤后,我们将获得一份分析结果。在此,我们审视总效应表格、中介变量模型表格、间接效应模型表格以及bootstrap法检验表格。

将重点关注总效应表格和bootstrap法检验表格,从而得出以下结论:
- Bootstrap检验中,平均因果中介效应(ACME)的估计值为 0.0883,且 P值 < 0.05(未直接显示但根据置信区间不包含0推断显著),95%置信区间为 [0.0404, 0.1456],未包含0,表明中介效应显著。
- 平均直接效应(ADE)估计值为 0.0147(P=0.842),置信区间包含0([-0.0964, 0.1415]),说明自变量(treat)对因变量的直接影响不显著。
- 总效应(total_effect)估计值 0.103(P=0.13),置信区间包含0([-0.0255, 0.2369]),表明总效应未通过显著性检验。
- 中介效应占总效应的比例高达78.58%,进一步支持焦虑状态的核心中介角色。
分析结果显示:无论是总效应模型还是bootstrap效应模型均未达到显著水平,这表明治疗对移民决策的直接影响较为有限。然而,通过焦虑这一间接路径,治疗的效果仍具有一定的实际意义。
5.实际意义与建设
① 通过缓解焦虑,治疗能够间接降低患者的移民倾向。在移民相关的健康政策中,心理健康干预措施(例如提供焦虑管理支持)可能是降低移民风险的有效策略。
② 需要进一步控制潜在的混杂变量(如移民政策、家庭支持等),以增强因果推断的可靠性。
③ 扩大样本量,以提高中介比例估计的稳定性。
6.总结
治疗(treat)在降低焦虑状态(Emo)方面对移民决策(cong_mesg)具有完全中介作用。尽管治疗的总体效应并不显著,但其通过心理机制的间接路径却具有统计学意义和实际应用价值。因此,建议优先考虑将焦虑干预作为移民健康管理中的一个重要方面。
END

