首页 理论教育 科研课题中样本含量严重不足的实例

科研课题中样本含量严重不足的实例

时间:2022-02-09 理论教育 版权反馈
【摘要】:对差错的辨析与释疑:要得出两台仪器的测定结果之间的差别无统计学意义的结论,仅凭对1个健康受试者4次重复测定数据进行比较,证据不足。若重复测定的结果之间变异度较小,样本含量n=6~8即可。每只动物任选一侧腮腺为实验组,另一侧作为正常对照,以消除个体差异及增龄对实验结果的影响。

4.3.4.1 样本含量很小,结论的可靠性

【例4-3-2】 某研究者为了证明A(HP-1000型超声诊断仪)、B(研究者自制的成像系统)两台仪器测定的结果无差别,作了如下的实验设计:选1个健康人作为受试对象,用A、B两台仪器前后两次(间隔为1个月)对此人分别重复测定4次,观测的定量指标分别是:①二尖瓣前叶EC幅度;②左室后壁运动幅度;③R-R间期。数据处理方法是:每个指标下有4组数据,既作了方差齐性检验,又作了配对比较的t检验,P值均大于0.1。

结论:两台仪器的测定结果无差别,可用自制的成像系统取代费用很高的同类进口仪器。

对差错的辨析与释疑:要得出两台仪器的测定结果之间的差别无统计学意义的结论,仅凭对1个健康受试者4次重复测定数据进行比较,证据不足。因为在实际操作中,每台仪器每天要测定多个受试者,由于不同受试者之间存在很大的个体差异,两台仪器对某1个人的测定结果之间的差别无统计学意义,并不能推出在多数人身上测定的结果之间的差别也是无统计学意义的。这是用“个案”取代一般规律的生动实例。

本研究涉及3个因素,其中1个是实验因素(即仪器),另外两个是区组因素(即测定时间和受试对象),故应选用交叉设计安排实验。若重复测定的结果之间变异度较小,样本含量n=6~8即可。反之,n应取10例或更多一些为宜。若从文献上查到交叉设计样本含量估计公式,按公式计算出n值,则更为妥当。

【例4-3-3】 原文题目:维甲类化合物Ro13-7410对HL-60细胞凋亡及分化诱导作用。原作者设计了如下1组实验来考察维甲类化合物Ro13-7410对HL-60细胞的诱导凋亡和分化作用。将HL-60细胞制成浓度为1×105/ml的细胞悬液,加入不同浓度(10-6mol/L、10-7 mol/L、10-8mol/L、10-9mol/L)的药物Ro13-7410,于给药后不同时间点(0d、1d、2d、3d、4d、5d)染色后进行活细胞计数,并做空白对照,得到30个数据。未作统计分析,仅根据数据的大小得出结论,10-6~10-9mol/L Ro13-7410,可明显抑制HL-60细胞增殖。

对差错的辨析与释疑:本实验涉及两个实验因素,即“浓度”和“时间”,其中浓度有5个水平(0mol/L、10-6mol/L、10-7mol/L、10-8mol/L、10-9mol/L),时间有6个水平(0d、1d、2d、3d、4d、5d),两个因素各水平完全组合形成30个实验点,每个实验点仅做了1次实验;如果实验因素间存在交互作用,此时却无法分析两因素交互作用效应的大小。

由于测得的30个数据来自同一细胞群,且在两因素不同水平的组合条件下测得,具有一定的相关性,因而将此实验视为具有两个重复测量的两因素设计比较妥当。需要增大实验批次,每个实验点至少安排两批实验,有条件的,可多安排几批;采用与此设计对应的方差分析方法处理数据,不仅可以消除数据之间相关性的影响,还可以全面分析各因素及因素之间可能存在的交互作用的效应,可降低实验误差,提高检验效能,得出更为稳定可靠的结论。

【例4-3-4】 为了观察甲紫注入小型猪正常腮腺后组织病理变化情况,有人选择6个月龄、体重20~25kg的中国实验用小型猪15只,雄性9只,雌性6只。每只动物任选一侧腮腺为实验组,另一侧作为正常对照,以消除个体差异及增龄对实验结果的影响。按注入甲紫后1周、2周、1个月、3个月及6个月将15只动物随机分为5组,每组3只(每个组的3只动物分别随机注入0.6ml、1.0ml及4.0ml 1%甲紫溶液),然后观察组织病理变化情况。试问:此项实验研究中违背了实验设计的什么原则?

对差错的辨析与释疑:本实验研究共用了15只小型猪,初看起来“15”这个数目不算太小。但仔细看一下不难发现,实验中共涉及两个实验因素:第1个因素是“甲紫作用时间”,它有“1周”、“2周”、“1个月”、“3个月”及“6个月”5个水平;第2个因素是“甲紫剂量”,它有“0.6ml”、“1.0ml“及“4.0ml”3个水平。这两个因素的全面组合共有15种情况,每种情况构成一个特殊的实验条件,每个条件下仅有1只动物.所以,本实验若列表表示,各组的样本大小n=1。这就违背了实验设计中的“重复原则”。因为生物医学研究的现象常常带有变异性,只有在相同实验条件下进行多次独立重复实验,随机现象的变化规律性才能正确地显露出来。

那么,各小组究竟应该用几只动物合适呢?严格地说,需要根据预试验或文献资料提供的信息,结合研究者对试验精确度的要求,并根据拟采用的实验设计类型,按估计样本大小的相应公式计算为宜。一般情况下,若不便用公式估算时,如果是小动物实验(来源方便,花费不太大),各小组动物数不少于10只为宜;若是较大动物实验,各小组动物数不少于5只为宜。这里所讲的“各小组”,是指实验中独立的实验条件所决定的每个小组,如本例中是指在一个特定的甲紫作用时间下同时在一个特定的剂量下所形成的实验组,即本例共有15个小组。

【例4-3-5】 新华网北京2003年4月17日电(记者×××):卫生部医药生物工程技术研究中心与广州市疾病控制中心科技人员合作,已成功建立荧光定量PCR快速检测冠状病毒的新技术。这一技术是卫生部、科技部非典型肺炎防治紧急科技行动”成果的一部分,有望为非典型肺炎的早期快速诊断提供可靠的实验诊断指标。卫生部医药生物工程技术研究所×××教授17日在向新华社记者介绍这项成果时说,运用这项新技术,从采取患者样品到报告结果可在2h内完成,能够实现对病毒基因的准确定量检测,可反映疾病的发生、发展过程。PCR是一种体外基因复制技术,可在几小时或几十分钟内把基因扩增到数百万倍以上,使基因便于检测。×××教授说,通过对广州市疾病控制中心提供的4例患者培养物和漱口液均检测出冠状病毒核酸,而3例确诊不是非典患者的样品均未检出。另外,30例健康人的漱口液全部未检出冠状病毒核酸,经过对4例冠状病毒阳性样品基因扩增片段测序结果分析,与加拿大和美国公开发表的冠状病毒基因序列比较同源性为100%。

对差错的辨析与释疑:众所周知,PCR检测的结果并非100%准确,也就是说,在其检测结果中可能会出现假阳性和假阴性的结果。既然如此,就不应将PCR检测的结果视为“确定性现象”,而是一个“随机事件”,欲反映随机变量的变化规律性就必须做大量的重复实验,才有可能显示出其变化规律性。仅检测4例非典患者的样品和3例疑似并最后确诊为不是非典患者的样品,就对此检测方法的准确性给予充分的肯定,是很不科学的态度,其结论的可信度较低。笔者曾处理过一份类似的实验资料,用PCR检测115份非典患者的样品,检测出冠状病毒为阳性的样品数为100份,即该方法的阳性检出率约为87%(=100/115×100%)。

【例4-3-6】 原文题目:不合格采样及送检导致生化指标波动原因的探讨。原作者分析化验室检测结果波动的4个因素:第1个因素是葡萄糖盐水输液,同侧采血和异侧(正常)采血的生化检测结果差异,用病房患者2次结果比较,结果显示:同侧采血时,对肌酐、尿酸等7项指标均有30%~200%的波动,其中血糖和氯的波动尤为明显;第2个因素是样本溶血和正常标本生化指标的差异,用病房患者2次结果比较,结果显示:标本溶血时,其中19项生化测定项目均有波动;第3个因素是时间依赖性项目在抽血后3种不同时间送检引起结果的差异,用1个患者的血样说明血氨在不同时间送检结果不同;第4个因素是抽血管错误,应该用血清管,但用了枸橼酸钠抗凝管后,造成生化结果波动。用5例患者两种不同抽血管的化验结果的变化率来说明差异。

对差错的辨析与释疑:原作者所说的“用病房患者2次结果比较”这句话很含糊,这里的“2”代表什么含义不清楚,容易使人理解为n=2。第1个因素含有2个水平,即同侧采血与异侧采血,仅用2次不同采血检测结果的变化率说明差异,实验次数太少不能说明两采血方式有差异;第2个因素也含有2个水平,即溶血样本和正常标本,同样也用2个样本检测结果的变化率说明差异,实验次数太少同样不能说明两样本检测结果是有差异还是没差异;第3个因素含有3个水平,即抽血后立即送检、1h后送检、2h后送检,仅用1个样本检测结果的变化率说明差异是没有说服力的;第4个因素含有2个水平,即血清管和枸橼酸钠管,是用5例患者使用不同采样管检测结果的变化率来说明差异的,数据个数虽不算太少,但未对数据进行统计学处理,是不便作出任何肯定或否定结论的。

化验室检测结果不同与送检样本是否合格是有关系的。原作者根据工作经验用4个可能导致化验结果不准确因素来说明问题是对的,但是每个因素仅用1~2个样本来说明问题,无法降低实验误差,所得出的结论是不可靠的。第1个因素含有2个水平,即同侧采血与异侧采血,每种采血方式至少5~10个样本,利用配对设计定量资料的t检验(差量近似服从正态分布时)或符号秩检验(差量不服从正态分布时)进行统计分析,得出P值。如果P<0.05,说明同侧采血与异侧采血的检测结果之间的差别有统计学意义,应选择正常的采血方式即异侧采血;第2个因素和第4个因素的处理方法与第1个因素相同;第3个因素是含有1个实验因素3个水平的实验研究,即抽血后立即送检、1h后送检、2h后送检,样本含量同上。若将每次抽取的样品一分为3,分别在3个时间点送检,则属于“具有一个重复测量的单因素设计资料”;若各次送检的样品是互相独立的,则属于“单因素3水平设计资料”。这两种情况下的定量资料,若满足参数检验的前提条件,应选用相应设计资料的方差分析处理;如果处理因素各水平下的总体均数所对应的结果为P<0.05,再用“Dunnett′s t检验”方法进行比较,即将1h后送检、2h后送检分别与抽血后立即送检比较;若3个时间点之间作两两比较,可以选用“q检验”等方法,从而作出科学的结论。

4.3.4.2 各观察组中样本含量相差悬殊,组间均衡性较差

【例4-3-7】 原文题目:健康儿童血清透明质酸水平。原作者系统观察了0~7岁的健康儿童血清透明质酸(HA)与年龄的关系,得出健康儿童血清HA含量与年龄之间呈密切负相关关系,r=-0.816 9,P<0.01。资料见表4-3-1。

表4-3-1 668名健康儿童血清HA水平

对差错的辨析与释疑:原作者在原文中说明对0~7岁健康儿童血清HA水平进行了系统观察,虽然样本含量较多共有668名,但在各个分组中,各组样本含量差异很大。7岁健康儿童数是新生儿的7倍,违反了实验设计的均衡性原则。

本实验应使各年龄组的例数基本达到均衡状态,严格遵循实验设计的均衡原则才能提高实验研究结果的可靠性。另外,是否有理由保证,除年龄因素外,没有其他因素对“指标HA”有影响?若不能保证,年龄大的儿童有较多机会接触其他某些因素,可能也导致“指标HA数值的降低”,这样,组间的不均衡性可能就更大了;在对数据进行统计处理时,还应使用原始数据直接进行统计分析,不应对资料进行分组后再做分析,这样会丢失很多有用的信息。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈