首页 理论教育 统计学三型理论应用的样例

统计学三型理论应用的样例

时间:2022-02-09 理论教育 版权反馈
【摘要】:为了让读者能够先睹为快,我们给出3个样例,以便读者能够尽快感受到统计学三型理论的价值和魅力,作为本章的结尾。统计学上与“基线值”对应的专有名词叫“协变量”,实现前述目标的统计分析方法叫“协方差分析”。对本例而言,其最合适的统计分析方法的全称叫做“具有两个重复测量的两因素设计定量资料

实验设计的核心内容是“三要素”、“四原则”和“实验设计类型”。人们在设计生物医学实验时,常表现在“设计类型”方面出错,但其本质可能是在“对照原则”与“均衡原则”方面出了问题。因此,它既可用“三型理论”来指导实验设计,也可用于辨析实验设计方面所出现的错误。为了让读者能够先睹为快,我们给出3个样例,以便读者能够尽快感受到统计学三型理论的价值和魅力,作为本章的结尾。

【例1-5-1】 为了探讨在体外具有强大细胞毒活性的口腔癌浸润淋巴细胞(TIL)在体内的抑瘤效果以及化疗药物环磷酰胺(Cy)与TIL联合应用治疗口腔癌的可能性。原作者取裸小鼠BALB/C-nu/nu15只,鼠龄6~8周,体重18~24g。随机分为3组,即对照组、TIL+rIL-2组和TIL+rIL-2+Cy组,每组5只裸鼠。从第1周开始观测肿瘤生长情况,设计与资料见表1-5-1。试辨析原作者在实验设计方面所犯的错误。

表1-5-1 各组肿瘤平均体积动态观察(±s,mm3)(表现型)

对差错的辨析与释疑:表1-5-1给出了本实验设计的“表现型”,看上去本实验似乎涉及到两个实验因素:一个叫“组别”;另一个叫“时间”。然而,此处的“组别”却不是一个普通的实验因素,它是由多个因素分别取不同水平的组合结果中的一部分。若将“TIL+rIL-2”视为一个不可分割的整体,则“组别”本质上是由“(TIL+rIL-2)用否”与“Cy用否”的4种水平组合中的3种组成,显然,在表1-5-1的设计中缺少了单用“Cy药”的那一组,这种错误叫“对照不全”。若在表1-5-1中,加上一行“Cy药”,此时所对应的设计就是问题的“原型”,见表1-5-2。

表1-5-2 与表1-5-1对应的问题的“原型”

注:t代表“观测时间(周)”

在表1-5-2中,假定“Cy药”这一行上也有实验数据,面对表1-5-2所表达的资料,很多人在判定实验设计类型时,仍认为此项实验中仅涉及两个实验因素,将其错误地判定为“具有一个重复测量的两因素设计”。事实上,应将“组别”拆分成两列,用两个实验因素明确地表示出来,见表1-5-3。由表1-5-3可知:它就是与此实验设计对应的“标准型”。

表1-5-3 与表1-5-1对应的问题的“标准型”之一

注:t代表“观测时间(周)”

值得注意的是:表1-5-3中第2行必需补齐实验结果。此时,表1-5-3所呈现的“标准型”,其设计名称为:“具有一个重复测量的三因素设计”,当资料满足参数检验的前提条件时,应选用“具有一个重复测量的三因素设计定量资料的方差分析”处理资料为宜。

如果TIL与rIL-2是两种可以合用、也可以分别使用的“物质或药物”,特别当他们分别处在“使用与否”的状态下,若存在不可忽视的“交互作用”时,则表1-5-1中的“组别”在本质上是由“TIL用否”、“rIL-2用否”与“Cy用否”的8种水平组合中的3种组成,仅从实验分组的角度看,表1-5-1的设计就缺少了5组,这种“对照不全”错误所导致的后果是割裂了整体设计,组间缺乏可比性,结论缺乏说服力。有兴趣的读者可试着列出此时的表格,即在表1-5-3的基础上,将左侧的两列改成3列,其实验因素的名称分别为:“TIL用否”、“rIL-2用否”与“Cy药用否”,他们都有“不用”与“用”两个水平,由这3个实验因素的水平全面组合可以形成8个组,表头上仍是5个时间点,此时的设计应叫做“具有一个重复测量的四因素设计”,见表1-5-4。若8行5列上都有重复实验数据,当资料满足参数检验的前提条件时,应选用“具有一个重复测量的四因素设计定量资料的方差分析”处理资料为宜。

表1-5-4 与表1-5-1对应的问题的“标准型”之二

【例1-5-2】 原文题目:咬合干扰对身体重心移动的影响。目的:了解咬合干扰是否会对身体重心产生影响。方法:对14名健康受试者实施人为的咬合干扰,测定其在干扰前、干扰后30min和干扰后24h身体重心的变化。其结果见表1-5-5。统计方法:应用配对t检验。结论:咬合干扰对人体重心移动会产生影响。试辨析原作者在统计分析方法选择方面所犯的错误。

表1-5-5 14名受试者睁、闭眼时身体重心移动距离的变化(cm)(表现型)

注:**与干扰前相比较;P<0.01,差异有高度显著性

对差错的辨析与释疑:表1-5-5是实际工作者呈现实验资料习惯采用的一种形式,它是一个“表现型”。根据这个“表现型”,人们很容易误用统计分析方法。因为它给人的印象是表中有两批实验数据:其一是“睁眼检测”的结果;其二是“闭眼检测”的结果。每批实验数据中又分为3个时间点上观测的结果,每位受试者均在这3个时间点上被重复观测,相当于进行了两次自身配对,故原作者采用配对t检验对此定量资料进行了处理,这是不正确的。

因为配对设计定量资料的t检验仅适用于分析差量服从正态分布的配对设计的定量资料;在配对设计中,只涉及一个具有2水平的因素,而本实验包含两个实验因素:一个是“检测时眼的状态”,它有“睁眼、闭眼”2个水平;另一个是“观测时间”,它有“干扰前、干扰后30min、干扰后24h”3个水平。对于每一名受试者来说,在这2个因素的不同水平组合条件下都被观测了定量指标的数值,故本资料应为“具有两个重复测量的两因素设计的定量资料”。从表1-5-5是很难看出其真正的实验设计类型的,按照此实验具体的实施步骤去呈现实验数据,可以得知,与表1-5-5对应的问题的“原型”如表1-5-6所示。

表1-5-6 与表1-5-5对应的问题的“原型”和“标准型”

注:表中“X”为观测值

表1-5-6不仅是表1-5-5的“原型”,同时,也是表1-5-5的“标准型”,只要列出了表1-5-6的式样,接触过这种实验设计类型的人就知道,它就是“具有两个重复测量的两因素设计”的标准型。发表论文时,若希望以简练的形式呈现资料的精华,可用表1-5-7的形式来表达。

表1-5-7 以概要形式表达的与表1-5-5对应的问题的“标准型”(±s)

注:表中“X”处应填写各条件下的“±s”

对于表1-5-6或表1-5-7中的定量资料,应选用什么统计分析方法处理为宜呢?当定量资料满足参数检验的前提条件时,若要求不高,可选用具有两个重复测量的两因素设计定量资料的方差分析对资料进行处理,此时,将每个检测状态下的3个时间点视为“地位平等”的;但仔细追究起来,感到并非很合理。因为在“干扰前”这个时间点上观测的结果仅与“测定状态”本身有关,而与“干扰的作用”无关;将此时的测定结果视为“基线值”或“本底”,若能设法将每个受试者的“基线值”化成相等的条件下,推测出“干扰的作用”大小,则更有可比性。统计学上与“基线值”对应的专有名词叫“协变量”,实现前述目标的统计分析方法叫“协方差分析”。对本例而言,其最合适的统计分析方法的全称叫做“具有两个重复测量的两因素设计定量资料的一元协方差分析”。用此方法处理此定量资料,不但可以消除数据之间的相关性对观测结果的影响,还可消除“基线值”不等对观测结果的影响,在此基础上,分析出各个因素及因素之间可能存在的交互作用的实验效应来。

【例1-5-3】 原文题目:碘化钠显影塑化剂显影效果的评定。研究目的:对一种碘化钠显影塑化剂在离体牙中的显影效果进行评估。材料和方法:①选择根尖孔自然封闭的离体牙65颗,其中上颌牙24颗,下颌牙41颗。以25号根管锉是否能进入根管的根尖1/3为准,将65颗牙分为粗、细根管两组。用显影塑化剂,按临床常规操作做离体牙的塑化治疗。塑化后拍摄X线片。1周后,采用特定仪器观察显影塑化剂在根管内的充盈状态,用测微尺测量显影塑化剂距根尖的距离;②X线片评价指标:从略。

原作者所用的统计学方法:χ2检验。结果:①显影塑化剂塑化后的离体牙显影效果的X线片评价见表1-5-8(还有类似的一张表从略)。由此表可知,总的显影对比度优良率为86.11%。经χ2检验(α=0.05),无论粗细根管还是上下颌牙之间均无显著性差异。②在离体牙中显影塑化剂的X线评价与体视镜评价的比较(资料从略)。结论:显影塑化剂的显影深度可真实反映其在根管内充盈的实际深度。试辨析原作者在分析定性资料方面所犯的错误。

表1-5-8 粗根管离体牙塑化后显影效果的X线片评价(表现型)

对差错的辨析与释疑:

(1)从原作者的研究目的可知,原作者对一种碘化钠显影塑化剂在离体牙中的显影效果进行了评估。从文中得知,影响该显影塑化剂在离体牙中的显影效果的因素有两个:一个因素是根管的粗细;另一个因素是牙位。其结果变量是“显影深度”和“显影对比度”这样两个有序的定性资料。原作者对粗、细根管的显影深度优良率和显影对比度优良率分别进行比较时,仅考察了“牙位”对结果的影响,没有考虑到不同根管对显影深度和显影对比度的影响,割裂了资料之间的相互联系。由以上的分析可知该资料所对应的列联表类型应为“结果变量为有序变量的三维列联表资料”。

(2)在选用统计分析方法时,原作者运用χ2检验(α=0.05)分析粗细根管还是上下颌牙之间的差别有无统计学意义。χ2检验只能分析两组(几组)率或构成比之间的差别是否有统计学意义,但当资料为“结果变量为有序变量的三维列联表资料”时,则不宜采用χ2检验。。

下面根据原作者的研究目的和资料所对应的列联表类型重新设计表格,影响该显影塑化剂在离体牙中的显影效果的因素有两个:一个因素是根管的粗细;另一个因素是牙位。结果变量分别是“显影深度”和“显影对比度”,他们都是有序的定性变量。该资料所对应的列联表类型为“结果变量为有序变量的三维列联表资料”。修改后的结果见表1-5-9。

表1-5-9 根管、牙位与显影深度的关系(表1-5-8的“原型”)

即使仅分析“显影深度优良率(%)”或“显影对比度优良率(%)”,也不适合选用一般χ2检验,因为资料中有两个原因变量(即牙根管种类、牙位)。显然,表1-5-8是问题的“表现型”,而表1-5-9是其“原型”,他们分别以表1-5-10、表1-5-11的形式表达时,就是其各自的“标准型”了。

表1-5-10 根管、牙位与显影深度的关系(表1-5-8的“标准型”之一)

应当如何处理表1-5-10资料呢?关键是给表1-5-10资料准确命名,此时的资料应叫做“结果变量为多值有序变量的三维列联表资料”,宜选用CMH校正的秩和检验或结果变量为有序变量的多重Logistic回归分析方法处理资料为宜。

表1-5-11 根管、牙位与显影深度的关系(表1-5-8的“标准型”之二)

应当如何处理表1-5-11资料呢?关键还是给表1-5-11资料准确命名,此时的资料应叫做“结果变量为二值变量的三维列联表资料”,宜选用加权χ2检验或对数线性模型或多重Logistic回归分析方法处理资料为宜。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈