2026/6/9 18:33:04
网站建设
项目流程
如何建一个网站教程,怎么制作网页调查问卷,图片街景位置识别,北京住建局源自风暴统计网#xff1a;一键统计分析与绘图的网站浙江大学医学院公共卫生学院宋培歌研究员团队在《Child Abuse Neglect》发表了一项因果推断研究论文。研究思路如下#xff1a;采用双重机器学习#xff0c;量化了不良童年经历#xff08;ACE#xff09;对流产、…源自风暴统计网一键统计分析与绘图的网站浙江大学医学院公共卫生学院宋培歌研究员团队在《Child Abuse Neglect》发表了一项因果推断研究论文。研究思路如下采用双重机器学习量化了不良童年经历ACE对流产、抑郁、焦虑及共病同时发生焦虑和抑郁的潜在因果效应。为了检验治疗效果的异质性进行了亚组和异质性分析。使用因果森林方法估计条件平均治疗效应CATE以捕获ACE效应的个体水平变化。进行了因果中介分析以评估妊娠流产的中介作用。用双重机器学习因果森林因果中介分析开展公卫研究值得一学我们详细解读一下双重机器学习开展因果推断研究旨在探讨不良童年经历对流产、抑郁、焦虑和共病的潜在因果关系并评估妊娠流产的中介作用。为了估计与ACE对妊娠流产数量和心理健康结果的因果解释一致的影响研究者采用了Chernozhukov等人Chernozhukov等人2018提出的双重机器学习DML框架。该分析使用R软件包“DoubleML”Bach等人2024进行。双重机器学习DMLDML是一种因果推断方法但并非一个单一的算法而是一个理论框架。其核心思想是利用机器学习模型来估计并剔除“滋扰参数”Nuisance Parameters的影响从而使对目标因果参数的估计对滋扰模型的估计误差不敏感。它将机器学习算法与奈曼正交化Neyman Orthogonality和交叉拟合相结合以减少估计偏差并提高在处理复杂和潜在非线性混淆结构时的稳健性。通俗来讲DML可以通过正交化和交叉拟合技术利用任意机器学习模型来处理高维混杂变量从而获得稳健的因果效应估计。研究的主要参数是平均治疗效果ATE它量化了ACE对流产、抑郁、焦虑及其合并症的潜在因果影响。另外研究者实施了一个五折交叉拟合程序以确保正交性和最小化过拟合。对包括Lasso、随机森林和XGBoost在内的机器学习算法进行了评估用于评估滋扰函数并选择了性能最佳的模型进行主要分析。结果显示随机森林模型始终表现出优越的预测性能通常产生最高的AUC和最低的MSE。因此我们选择使用随机森林算法从DML框架导出的结果作为我们的主要发现。每个模型在所有处理变量和结局变量上的out-of-sample AUC和MSEACE暴露显著增加流产以及抑郁、焦虑和共病的概率。使用随机森林算法从DML中得出的ACE对流产、抑郁、焦虑以及共病的估计ATE另外为了评估估计的因果效应的稳健性将原始随机森林模型的ATEs与使用Lasso和XGBoost算法获得的ATEs进行了比较。结果显示ACE与所有四种结果之间关联的方向、幅度和显著性在三种机器学习模型中基本一致。这种跨算法发现的趋同强化了主要结果的稳健性。比较三种机器学习算法Random Forest、Lasso、XGBoostATE 估计值处理效应异质性分析为了检验处理效应的异质性HTE研究者按年龄和教育程度进行了亚组分析。此外使用因果森林方法估计条件平均治疗效应CATE以捕获ACE效应的个体水平变化Wager Athey, 2018。关于处理效应异质性HTE和条件平均治疗效应CATE的概念我们曾写过推文介绍感兴趣的朋友可以看看。现在是该了解 处理效应异质性HTE的概念与方法的时候了Out了! 临床研究亚组分析现在有两个新的概念HTE、CATE顶刊论文的亚组分析森林图如何绘制| 处理效应异质性HTE分析方法异质性分析显示对于流产受教育程度较低的女性的相关性更强。例如暴露于任何ACE显著增加初等教育组的流产数量而高学历组的影响较弱且不显著。对流产次数的影响也集中在45岁以上的女性中而在≤45岁的女性中无统计学意义。就心理健康结果而言受过初等教育的妇女的影响始终更大。然而与流产不同的是对年轻妇女≤45岁心理健康的不利影响更为明显。热力图展示了基于随机森林的双重机器学习模型中按年龄和教育水平定义的亚组估计的 ATE因果森林模型证实了所有结果存在显著的个体水平异质性。在参与者中有很大比例的流产CATEs呈阳性这表明对有意义的个体子集而言风险直接增加。在心理健康方面CATEs也有很大差异突出了个体对ACEs的不同易感性。这些异质性模式在ACE评分和所有ACE亚型中是一致的。任何不良童年经历对流产次数和心理健康结果影响的个体水平异质性因果中介分析为了评估妊娠流产是否在ACEs与心理健康结果之间起中介作用采用“ mediation ” R包进行因果中介分析Tingley et al., 2014。估计了直接和间接效应以及通过妊娠流产介导的总效应的比例。研究发现妊娠流产数与抑郁、焦虑以及共病显著相关随机森林、Lasso和XGBoost模型的ATE估计值一致。基于这些结果以流产次数为中介对每个结局进行因果中介分析。在所有结果中间接中介效应具有统计学意义但幅度较小。具体而言流产的数量只占整个ACE-心理健康关联的一小部分抑郁为2.37%抑郁和焦虑共病为2.43%焦虑占比最大4.96%但仍然有限。本研究的一个显著优势在于它使用了先进的因果推理技术特别是DML框架来估计ace对流产和心理健康结果的治疗效果。该方法针对高维混杂因素进行灵活调整从而能够对因果效应进行更稳健的估计从而细致地了解将早年逆境与日后健康结局联系起来的路径。因果推断方法现在已然成熟在越来越卷的科研时代因果推断可能是破局之道也是未来的大势所趋诸位得抓紧学起来了最后在文末给郑老师我们团队打个广告吧大家不要见怪哈欢迎参加郑老师主持的因果推断训练营