- 例解贝叶斯Meta分析基于R语言
- 张天嵩 董圣杰编著
- 3105字
- 2025-03-14 17:51:57
第四节 贝叶斯Meta分析模型
一、贝叶斯Meta分析基本概念
循证医学是近些年来国际临床医学领域迅速发展的一种新的医学模式,其核心思想是任何医疗决策都应该基于客观的临床研究的证据。Meta分析是循证医学重要的技术和工具,是证据汇总的定量分析方法,它是将独立研究的结果结合起来,提供一个共同效应估计的方法,即合并不同研究的效应值。近些年来贝叶斯统计方法也被广泛应用于Meta分析,特别是复杂模型如纵向数据Meta分析、网络Meta分析等。贝叶斯Meta分析是采用贝叶斯原理对多个同类研究结果进行合并汇总的统计分析体系。随着计算方法的发展,其具有处理复杂模型以及解决传统方法无法解决的问题的能力。
贝叶斯Meta分析将估计参数视为随机变量,而非固定值。结合纳入研究的样本信息及先验信息,获得后验信息,并基于后验信息进行完整的参数估计及统计推断。因所有参数均有分布,因此所有参数均可获得点估计及区间估计。例如频率学派Meta分析中异质性方差τ2是由矩估计获得,并无置信区间。
在经典Meta分析过程中经常会遇到以下情况:①罕见事件的Meta分析,即纳入研究数据呈明显稀疏性;②纳入研究数量较少。因此频率学派Meta分析会导致一系列有偏估计。贝叶斯统计框架下,通过引入弱信息先验分布(weakly informative priors,WIPs)来调整(或稳定)估计值。稀疏数据的Meta分析主要的问题在于效应量方差或标准差的估计,贝叶斯方法可针对方差项引入弱信息先验分布。基本思想是当采用无信息先验时,方差项后验抽样会出现过度离散现象,而采用弱信息先验分布可适当限制过度离散,进而获得稳健的后验估计。
二、经典Meta分析模型:正态-正态层次模型
经典Meta分析是典型的二步过程,其基本原理是:第一步,计算纳入Meta分析的每个研究的统计量。用相同方法来描述每个研究干预的观测效应量。第二步,通过对每个研究干预的观测效应量进行加权取平均数来获得总的合并干预效应。
从贝叶斯统计的角度来讲,Meta分析的本质为层次模型,根据各项研究的真实效应值是否相同可以分为固定效应模型和随机效应模型,如图1-8。虽然固定效应模型可以在不考虑异质性的情况下用于估计共同效应,但有可能夸大综合效应的精度。层次随机效应模型的贝叶斯方法可对异质性和未知的处理或研究效应进行估计。层次贝叶斯方法在处理Meta分析中出现的问题具有明显优势,例如在第二阶段先验分布进行选择,用于评估小型研究或非高斯效应的稳健推断,以及在假设的新研究中进行预测。本节将以正态-正态层次模型为例进行简单介绍。

图1-8 固定效应模型和随机效应模型
固定效应模型下,假设所有纳入Meta分析的研究来自同一个总体,拥有相同的效应值(量级和方向均相同),因效应值固定,所以称为固定效应(fixed-effect,FE)模型。经典的Meta分析数据类型为连续型数据(如比值比对数、相对危险比对数、风险比对数、率差、均数差、标化均数差等效应量),假设有n个研究,每个研究的效应值为yi,对应的标准误为si,固定效应模型为:yi~Normal(μ,)。式中,μ为yi的加权均值,权重由1/
计算获得,此方法对应于频率学派的倒方差法。
随机效应(random-effects,RE)模型假设每个研究效应量来自各自的正态分布,而这些正态分布的均值服从更高水平的正态分布,随机效应模型即估计更高水平正态分布的均值,具体模型如下:yi~Normal(μi,),μi~Normal(θ,τ2)。式中θ为合并的均值,τ2为研究间的方差,二者为模型待估计参数,在贝叶斯分析中,须指定先验分布。通常θ选用无信息正态分布,τ2选用无信息Gamma分布。
经典Meta分析的统计模型对于计算和解释Meta分析的结果非常重要,但由于固定效应模型和随机效应模型采用相似的公式计算统计量,有时可能得到相似的结果,以至于被误认为两个模型可以相互替换使用。但实际上,不同的模型基于不同的假设,并且提供不同的参数估计值。Meta分析中如何选择统计模型,历来存有争议。不同的人偏爱不同的事物,不同的统计学家和临床研究人员可能偏爱不同的统计模型,即使是第6版《考克蓝干预措施系统评价员手册》也未能提供权威统一的推荐意见。笔者认为,应从统计模型假说、Meta分析目的、纳入Meta分析的研究数量和样本量、研究间异质性、抽样框架等不同方面综合考虑来选择合适的统计模型,并建议在制定系统评价/Meta分析研究方案时就应该考虑选择合适的模型。基于随机效应模型的假说和抽样框架更符合实际、统计推断目的对研究者而言更有吸引力、从数学角度而言固定效应模型是随机效应模型的特例等方面来考虑,除了使用随机效应模型不可能(如只有一个研究)、不合理(异质性参数估计不可靠)等情况外,在Meta分析时应首先选用随机效应模型。但应牢记《考克蓝干预措施系统评价员手册》的重要观点:“决不应该根据异质性统计检验做出使用固定效应模型或随机效应模型的选择”。
[例1.10]以阿司匹林及安慰剂预防心梗死亡的数据为例,采用R语言rjags包演示贝叶斯Meta分析过程。数据如表1-3所示:
表1-3 阿司匹林及安慰剂预防心梗死亡的数据

[解]对于研究MRC-1,OR=[(615-566)×557]/[566×(624-557)]=0.718,y1=ln(OR)=-0.328 9,=Var(ln(OR))=1/(615-566)+1/566+(1/624-557)+(1/557)=0.038 9,其余类似。OR值为偏态分布,对数化后近似服从正态分布,每个研究的效应量及相应标准误结果如表1-3。
首先进行固定效应模型的计算,具体过程如下:

主要计算结果如下:

由上述结果可知,d=ln(OR)=-0.109,OR=0.891,95%CI(0.841,0.956)。结果中Rhat为潜在尺度缩减因子,均接近1,说明收敛良好。三个参数的核密度估计图及踪迹图如图1-9。

图1-9 固定效应模型参数核密度估计图及踪迹图
随机效应模型运行代码如下:

主要计算结果如下:


由上述结果可知,d=ln(OR)=-0.146,OR=0.868,95%CI(0.706,1.029),研究间异质性方差点估计及95%CI为0.039(0.000,0.195);结果中Rhat为潜在尺度缩减因子,均接近1,说明收敛良好。四个参数的核密度估计图及踪迹图如图1-10。

图1-10 随机效应模型参数核密度估计图及踪迹图
三、贝叶斯Meta分析模型拟合与比较
任何统计分析的一个重要部分都是评估来自特定模型的预测与观测数据的吻合程度。如果所选模型的预测与数据不太吻合,那么该模型的任何输出,如参数估计、预期净收益、结果的最佳处理策略均具有不确定性,都不能很好地反映证据基础。在贝叶斯Meta分析过程中会有不同的模型,如固定效应模型及随机效应模型等,如何合理的选择模型至关重要。
拟合优度的标准统计量,如残差、残差平方和(RSS)和残差偏差(通常称为似然比统计量)都可以在贝叶斯框架内计算,以评估模型的拟合。贝叶斯统计最常用的是残差偏差(residual deviance)。偏差统计量是用似然函数测量由特定模型作出的预测与观测数据的拟合度。定义为对数似然函数(Loglikmodel)的-2倍,即:

对应给定的模型,对数似然函数越大拟合越好,因此Dmodel就越小。偏差统计量越小,模型拟合越好。但是多小才算小呢?使用原始偏差统计量(Dmodel)的缺点是对这个问题没有明确的答案。残差偏差(Dres)通过提供一个参考点,帮助衡量模型拟合的好坏。定义为:
Dres=Dmodel-Dsat
其中Dsat为饱和模型的偏差。对于一个能很好地拟合数据的模型,期望个体对残差偏差度的贡献大致是服从自由度为1的卡方分布。如果观测数据正态分布的似然,这是精确服从卡方分布。如果对N个无约束数据点进行求和,那么残差偏差的期望近似服从自由度为N的卡方分布。
有效参数个数(effective number of parameters,pD)用来度量模型的复杂程度,定义为:

其中为模型偏差的后验均值,D(
)为参数为
时的偏差值。
Spiegelhalter等提出用偏差信息准则(Deviance Information Criteria,DIC)来比较贝叶斯模型。它利用和AIC类似的思想,使用DIC来综合表示模型的拟合度及模型的复杂程度,即:

DIC判断准则为如果两个模型的DIC相差大于5,说明DIC较小的模型更好;如果两个模型的DIC相差小于3,说明两个模型无太大差别。
以前文阿司匹林及安慰剂预防心梗死亡的数据为例,固定效应模型DIC=-2.7,随机效应模型DIC=-2.8,相差非常小。这种情况下,固定效应模型更为简单,且便于解释,因此本例更适合选用固定效应模型。