重复测量资料方差分析
重复测量(repeated measure)是指对同一观察对象的同一观察指标在不同时间点上进行的多次测量,用于分析该观察指标在不同时间上的变化特点。这类测量资料在临床和流行病学研究中比较常见,例如,为研究某种药物对高血压病人的治疗效果,需要定时多次测量受试者的血压,以分析其血压的变动情况。
1、 重复测量资料方差分析中自由度调整方法
1.调整系数?的计算
?(G?G??),计算有两个调整系数,第一个是Greenhouse-Geisser调整系数?公式为
2a2(skl?s2)2???2(a?1)[??(s)?(2a)(?(s))?a(s)]2kl22k2222klk2
s=(式中中的skl是协方差矩阵中的第k行第l列元素,
??skl2kl)/a2是所
skk?(有元素的总平均值,
2?sl2ll22)/a2是主对角线元素的平均值,sk?(?skl)/al?的取值在1.0与1/(a-1)之间。 是第k行的平均值。?第2个系数是Huynh-Feldt调整系数?(H?F?)。研究表明,当?真值在0.7
?进行自由度调整后的统计学结论偏于保守,故Huynh和Feldt以上时,用?提出用平均调整值?值进行调整。?值的计算公式为
????2ng(a?1)? ?](a?1)[(n?1)g?(a?1)?·1·
式中中的g是对受试对象的某种特征(如年龄或性别)进行分组的组数,n是每组的观察例数。当?>1.0时,取?=1.0。
2. 调整规则 只对具有重复测定性质的时间效应的F值的自由度,和处理时间交互作用的F值的自由度进行调整。由于F值的有两个自由度v1和v2,调整的分子自由度?1??1?? 分母自由度?2??2??。具体计算时可用或?代替。用调整所得的?1及?2的F值查临界值表,得F?(?',?')。由于??1.0,所以调整后的
12''''F临界值要大于调整前的F临界值。
2、单因素重复测量资料的方差分析
单因素重复测量资料的例子 一项关于不同药物治疗心律失常效果的对比研究。对9例经常出现心室早搏的病人于用药前测定其心率后进行随机化给药。一部分病人按A药?安慰剂(C药)?B药的顺序给药,另一部分病人按B药?安慰剂(C药)?A药的顺序给药。安慰剂(C药)持续一周,作为药物后效的清除期。比较用药前与各种药物及A药与B药之间的心律差别。图4-12列出9名受试病人在用药前、安慰剂(C药)期及药(A与B)期的心率。
病人号 永药前 A药 B药 C药 1 94 67 90 67 2 57 52 69 55 3 81 74 69 73 4 82 59 71 72 5 67 65 74 72 6 78 72 80 72 7 87 75 106 74 8 82 68 76 59 9 90 74 82 80 图4-12 心室早搏病人在用药前后的心率
方差分析的步骤
1. 提出检验假设 检验假设为:
H0:μ1=μ2=μ3=μ4;
H1:μi≠μh,至少有一个不等式成立。
2. 计算离均差平方和、自由度及均方 有总离均差平方和、处理因素离均差平方和、受试对象间离均差平方和及受试对象内离均差平方和等。计算公式为:
(1) 总离均差平方和ss总及总自由度?总的计算
·2·
ss总???(Yij?Y)2?s?T2/N,?总?N?1
j?1i?1an(2) 处理因素的离均差平方和ss处理及自由度?处理的计算
ss处理1a2T2,?处理?a?1 ?n??(Yj?Y)?(?Tj)?nj?1Nj?1a2(3) 受试对象间离均差平方和ss对象间及自由度?对象间的计算
ss对象间1n2T2?a??(Yi?Y)?(?Ti)?,?对象间?n?1
aNi?1i?1nnn受试对象内离均差平方和ss对象内及自由度?对象内的计算
ss对象内Ti2?a??(Yij?Yi)??(si?),?对象内?n(a?1)
ai?1i?12(4) 误差的离均差平方和ss误差与自由度?误差的计算
ss误差?ss总?ss处理?ss对象间,?误差?(n?1)(a?1)
根据以上4种离均差平方和与自由度计算所得的均方见表10-2.
3. 计算F值 由于是处理因素的统计学检验,故只计算处理因素的F值。
F处理?MS处理/MS误差,F处理服从?1??处理与?2??误差的F分布
本例,在DPS数据处理系统中,按图4-12方式编辑、定义数据块,然后执行“试验统计”→“重复测量方差分析” →“单因素分析”功能,得到计算结果如下。
计算结果 处理 处理1 处理2 处理3 处理4 变 异 来源 处理对象间 处理对象内 处理间 误 差 当前日期 02-8-16 8:42:12 样本数 79.7778 67.3333 79.6667 69.3333 均值 11.48670 7.74600 12.01040 7.81020 标准差 F 值 8.21898 显著水平 0.000616 表 方差分析表 平方和 2023.722 2339.250 1185.417 1153.833 自由度 8 27 3 24 均 方 252.9653 86.6389 395.139 48.0764 调整p=0.0020 调整p=0.0006 4362.97 35 总 变 异 Greenhouse-Geisser ε=0.7774 Huynh -Feldt ε=1.1169 ·3·
DPS程序给出处理因素的F值为8.22,p=0.0006,故拒绝无效假设,说明处理因素间的差别具有统计学意义。
由计算结果可以看出,受试对象内离均差平方和等于处理因素的离均差平方和与误差的离均差平方和两项之和。
?=0.7774,H?F?= 1.1169。用??调整的处理因素的DPS系统还给出G?G?分子自由度为0.7774×3=2.33≌2.0;分母自由度为0.7774×24=18.66≌19。计算得调整自由度后的显著水平p=0.0020,比未调整的F临界值大。未调整的概率P=0.0006。
附:平均值之间的多重比较
以上用单因素重复测量方差分析方法对心率资料进行分析之后所得到的统计学结论是:拒绝无效假设,即在治疗药物的四个水平中,至少有一个水平的总体平均值不同于其他水平的总体平均值。为了确定这个特殊总体,必须进行平均值之间的多重比较。但此处不能采用一般的多重比较方法,因为那些方法都是建立在独立样本基础上的。这里可采用配对样本的差值t检验,因为配对样本就是重复测量试验中一种最简单的对比研究设计。如果用手算,其检验骤如下:
1. 计算每一个病人在不同给药情况的差值:di(j-h)=Yij-Yih,i为病人号,j,h为药物水平号。若设计时只考虑用药前与各种药物及A药与B药之间差别情况,可只计算di(1-2)、di (1-3)、di (1-4)及di (2-4)四种组合,而不是所有可能6种组合。
2. 根据公式t?dSdn计算差值t检验统计量,这里可分别得到t值为:
t(1:2)=4.41, t(1:3)=0.03, t(1:4)=3.19, t(2:4)=-0.96
3. 计算校正临界值t 由于是对同一份资料进行多重比较,为克服累积I类错误对结果判断所造成的影响,根据Bonferroni不等式原理对临界t值进行调整。
首先确定比较的次数c。因该研究已事先确定只作4次比较,故c=4。若在方差分析之后再作多重比较,则只能取所有可能的比较次数。例如本例在方差分析之后再进行比较时,则比较的次数应为c=4(4-1)/2=6。
其次是选择累积I类错误的概率??=0.10.采用双侧检验,每次检验所用的I类错误概率水准为?=0.10/4=0.0125,自由度v=n-1=8,在DPS电子表格中输入“=ttest(8,0.0125)”,回车后即可得到自由度为8时t0.0125的临界值3.2059。与前面计
·4·
算出的t值相比较,可见用药前心率与服用A药后心率之差具有统计学意义。用药后心率平均降低12.44次/分,而用药前心率与服安慰剂后心率之间以及A药与B药之间心率之差无统计学意义。用药前心率与用药后心率之差接近显著性水平。
其实,在DPS数据处理系统中,只要将数据编辑、定义成如图4-12格式,然后执行“试验统计”→“平均数比较” →“Bonferroni测验”功能,这时系统会给出如下对话界面:
在该对话界面,用户可在左边选择比较的组合,在右边上部选择比较方法,这里采用的配对比较,故在比较方法框中用鼠标点击“配对比较“,然后按确定按钮,这时得到计算结果如下。
计算结果 当前日期 02-8-16 9:08:52 比较组别 均值差 标准差 t 1<->2 12.44444 8.47218 4.40658 1<->3 0.111111 10.83333 0.030769 1<->4 10.44444 9.83757 3.18507 2<->4 -2.000000 6.22495 0.963863 p 0.043458 0.250000 0.059605 0.167539 其结果解释和手算结果相同。
3、 两因素重复测定资料的方差分析
两因素重复测定资料中的因素是指一个组间因素(处理因素)和一个组内因素(时间因素)。组间因素是指分组或分类变量,它把所有受试对象按分类变量的水平分为几个组。组内因素是指重复测定的时间变量,例10-1只有组内因素,没有组间因素。
·5·
重复测量资料的方差分析



