Meta 回归在 Stata 12.0 中的操作指南及基本概念介绍

原帖作者也提供了相应的数据文件(无需丁香园论坛币)

下载链接:

原帖全文如下:

寒假期间我结合周版主的视频和关于丁香园中元回归的帖子,对Stata 12.0中元回归的具体操作进行了总结,与大家分享和讨论元回归相关的问题!

在开始Meta回归之前,我觉得有必要介绍一下Meat回归的基本概念。

1.元回归的定义

元回归本质上仍然是一种回归分析方法,它与回归、线性回归等其他回归方法的区别在于,元回归的回归对象是单个研究,而回归和线性回归的回归对象是单个研究中的个体数据。元回归常用于Meta分析,探讨研究间异质性的来源和大小,并进一步解释异质性对Meta分析中综合效应大小的影响。具体而言,在Meta回归中,异质性的来源可以是实验干预的剂量、年龄、地点、语言等。

2.2.0中的元回归操作步骤

(本示例数据见附件)

步骤 1:按以下格式在 .0 中输入数据:

(直接从Excel复制数据到stata,然后使用命令重命名)

步骤2:由于itt、allo、phd为字符变量,在元回归中软件无法识别它们(::),因此在进行元回归前需要给它们赋值。在命令栏中输入命令:

.gen abs==="是"

. =itt=="是的"

. =allo=="是的"

. =phd=="是的"

(注:95% CI 计算使用命令:=(log(ul)-log(or))/1.96)

结果如下:

步骤3:我们先进行单协变量回归,所谓协变量()是指除了因变量之外,其他可能影响响应变量的变量。比如,我们研究维生素A剂量与腹泻发病率的关系,这里,维生素A剂量就是因变量(或),腹泻发病率就是响应变量(或)。如果我们在Meta分析中发现,维生素A的干预方式(、糖浆或)、研究地点(中国、日本)和干预时间(6、1年甚至2年)等因素对腹泻也有影响。那么,在“维生素A剂量与腹泻发病率研究”中,协变量就是干预方式、研究地点和干预时间。这里我们的协变量任意定义为。标签说明如下:

注1:

1. 在(y)列中输入响应变量。对于连续变量,在此输入SMD(或WMD、MD);对于二元变量,在此输入logrr或logor;

2. 在一列中输入协变量,应在此处输入;

3.-study列有两个选项,一个是Std.Error,另一个是。这一列要求你选择对回归系数进行加权的依据。一般选择Std.Error。还有一个选项是指明每个study中包含Std.Error的变量。这里应该是sesmd(如果是二元变量,应该是或;

4. BS一栏需要选择算法,这里一般选择ReML( )。

阐明:

1. 如果选中此选项,Stata 将在图表中绘制圆圈,圆圈的大小取决于每个研究的权重(

)而不是研究的精确度(

)。实际上,勾选与否对回归结果影响不大。原因是:由于研究间差异(

)较小,所以权重和精度值接近。如果勾选该选项,圆圈会变小;

2. 图表:勾选此选项,结果中会生成相应的图表。注意此选项仅在只有一个协变量时适用;

3.Eform:勾选此选项,回归系数结果将以指数形式表示。

(电子表格已核实状态)

(Eform不勾选)步骤4:点击OK之后,会得到相应的结果:

结果解释:

1. Tau2 - 研究间变异的分量。其值越小,模型的拟合度越好。

2. I--res - 异质性解释的残差变异量。这里,异质性解释了 55.83% 的残差变异(另外 44.17% 的残差变异由研究间变异解释);

3. 调整 R - 当前模型中包含的协变量可以解释的研究间变异量。这里,可以解释的研究间变异量为 55.16%。

步骤5:如果包含多个协变量,可以得到以下结果:

结果解释:

模型F(5,4)——所有协变量的联合检验,零假设是所有协变量的回归系数都等于0。在F(5,4)中,5代表纳入的协变量个数,4代表???;若P值小于检验水准(0.01或0.05),表明在纳入的多个协变量中,至少有一个协变量与反应量相关(至于哪个协变量相关及相关程度,无法从P值推断)。

步骤6:随着模型中包含的协变量个数增加,所得结果犯I型错误的概率增大,因此需要利用蒙特卡洛方法对P进行修正:

勾选该选项框,在右侧的数值框中输入蒙特卡洛随机排列的次数,一般为5000次或者20000次,勾选后计算结果会更加准确。

(=50)

(=100)

(=200,并检查)如果垂直方向的P值逐渐增大(是垂直的还是水平的??请指点迷津),说明确实存在Type I错误,如下图所示:

另外,由于蒙特卡洛方法采用随机排列,如果希望两次结果相同,则应在执行蒙特卡洛方法之前使用命令:set seed。

好了,我的演示步骤就到此结束了,如果有错误的地方,还请指正!谢谢

(三)元回归的注意事项:(1)确保有足够多的研究纳入回归分析,如确保每个协变量模型至少有10个观测值;(2)在研究过程中预先确定要分析的协变量;(3)选择少量的协变量;(4)对每个协变量的探索必须符合科学原理;(5)协变量之间不应存在相互作用。

(四)元回归纳入的协变量个数的推断公式为:N=纳入研究个数/10。

(五)关于元回归的问题(请高手帮帮忙!!!)

(1)多个分类变量的元回归(>=3)

关于多分类变量的虚拟变量赋值方法,我参考了《实用循证医学方法论》中的相关内容,但还有疑问,现描述如下。假设协变量(,中国和日本)对SMD有影响,我在stata中使用如下方法赋值虚拟变量:,(),结果如下:

我的问题是:

1. 是吗?2 是中国?3 是日本?如果是,为什么回归结果中只有和?2 去哪了?另外,_cons 行是什么意思?

2.我想研究这个协变量是否是异质性的来源,但是赋虚拟变量之后就分成了三个新的协变量,这种情况下如果1和2的P值小于检验水准,3的P值大于检验水准,那么就说明1和2这两个协变量是异质性的来源,而3不是。那么它到底是不是异质性的来源呢?!

(2)关于蒙特卡洛运算

在蒙特卡洛计算中,周先生在他的视频中说“如果P值逐渐增大,说明确实存在I型错误。”那么我们应该横向比较P值还是纵向比较(如下图所示)?!

(3)下图中,F(5,4)中5表示纳入的协变量的数量。4代表什么?

(4)Meta- 与 dose- 我在 PLOS 上看到丁香园发表的一篇文章,里面有一个 dose- 图(见下图 1),跟我们的 Meta- 图很像(包含协变量时见图 2),图 1 中的 dose- 是不是通过 Meta- 实现的?!Meta- 和 dose- 是什么关系?!

(图1)

(图 2)

数据-.xls(14.5k) 在线查看

© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender