编者按:
精选课件
医学科研中常用统计方法及错误解析
李连红 博士南京医科大学第二附属医院 感染管理科
一篇优秀的医学论文应该具备:
案例
降钙素原对成人下呼吸道感染
诊断价值的研究
中华检验医学杂志 2011,34(12):1069-72
通常认为血清降钙素原(PCT)能更好的提示全身性细菌感染或脓毒症,但有研究发现脓毒症患者PCT波动范围较大,甚至可能低于0.5mg/l。那么若想探讨降钙素原在成人下呼吸道感染中的诊断价值。
1、如何设计?
2、要搜集多少样本?
3、应采用什么样的指标来反映其诊断价值?
4、搜集数据后用什么方法分析?怎么实现?
卫生统计学将回答上述问题!
一、统计学在医学科研中作用
1、统计学是进行医学科研的重要工具
2、满足统计学原则要求是保障医学科研科学性的前提
3、采用恰当的统计学方法是研究结论可靠、可信的前提
4、课题申报、论文撰写均有明确的统计学要求
二、合理选择统计方法的四个因素
(一)研究设计
(二)分析目的
(三)资料类型
(四)数据特征
(一)研究设计
1、完全随机设计(成组设计)
——最常见,最易实施的实验设计方案
——将研究对象随机分配到几个组,然后做实验
2、配对设计(区组设计)
——将具有相似特征的研究对象配成对子,然后再将每个对子的对象随机分配到两个组进行实验
——例如,研究血液透析机的消毒效果,同一台机器同时采集2份标本,一份做细菌培养,一份做内毒素检测
3、析因设计
——同时研究多个实验因素对结果的影响
——例如,研究药物剂量(3mg、6mg)及给药方式(口服、肌注)对结果的影响,每种组合均需要做试验(3mg+口服,3mg+肌注, 6mg+口服, 6mg+肌注),为2×2析因设计
4、重复测量设计
——同一对象在不同时间点上进行某个指标的观测,以分析该指标在时间上的变化。
(二)分析目的
1、对临床资料进行统计描述
描述性统计分析方法:如均数,中位数,标准差,百分比,频数分布等
2、对几组资料进行差异性检验
假设检验方法:如t检验,卡方检验,方差分析,秩和检验等
3、探讨变量之间的关系,或者自变量(影响因素)对应变量(结果变量)的影响大小
多变量分析:如线性相关,线性回归,回归,Cox回归、生存分析等
(三)资料类型
临床上数据资料分类:
1、计量资料,数值变量,每一个观察对象都有一个数值,且大小差异有意义,如血压、心率、年龄、尿量。
2、分类资料,属性分类。
(1)无序分类:指类别或属性间无顺序、程度之分
例如:性别(男、女)为二分类
血型(A、B、AB、O)为多分类
(2)有序分类:指类别间存在着次序,或程度上的差异。
例如:治疗效果:无效、好转、显效、治愈
实验室检验:–、+、++、+++
(四)数据特征
1、任何统计方法都有自己的适用条件,只有当某个或某些条件满足时,统计计算公式才成立
2、适用条件可根据数据特征来判断
——数据的分布特征(正态、偏态)
——方差齐性
——理论数(T)大小
——样本量(n)大小
三、数据资料的描述
(一)数值变量资料的描述
重要的分布——正态分布( )
大量连续随机变量都符合正态分布。小样本量需做K-S检验/S-W检验判断是否符合正态分布。
正态性检验
正态性检验结果解读
偏态分布形状
右偏态:如血铅含量、尿汞含量
左偏态:如肺活量
四分位数
- 下四分位数: 25 , P25
- 上四分位数: 75 , P75
四分位数间距: P75 - P25
方差齐性
方差是否齐同(相等)
粗略判断
两组标准差之比在2.5倍以上,就得警惕方差不齐
SPSS如何变量描述
(二)分类变量资料的描述
通常需要描述各个类别的频数及频率(百分比)
1、构成比:各类别在总数中的比重或百分比。
2、率:如果数据分为发生或不发生,如死亡、患病等,则可计算其死亡率、发病率等指标,表示其发生的强度。
3、比:相对比,是两个有关指标之比。如男女性别比,医护比,床护比
不能以构成比代替率的分析!
正确求平均率!
优势比、相对危险度
1、优势比(OR) 是在病例对照研究中表示疾病与暴露之间的联系强度
2、相对危险度(RR) 是两种暴露与非暴露组发病率之比,队列研究(前瞻性研究)。
>1危险因素;
您能看懂这个图吗?
:降钙素原诊断细菌性脑膜炎--外周血 vs 脑脊液
,2016,95(11):e3079)
SPSS实现分类变量资料的描述
结果解读
四、数据资料的组间比较
根据资料类型选择
1、计量资料的假设检验
t检验、F检验(方差分析)、Z检验、秩和检验(秩和检验、H检验、检验)等
2、计数资料的假设检验
卡方检验、Z检验等
3、等级资料的假设检验
秩和检验(秩和检验、H检验、检验)
1、常用计量资料假设检验方法
独立样本t检验
结果解读
2、常用计数资料假设检验方法
卡方检验
卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量
1、基本思想
(1)假设两总体率相等
(2)实际数与理论数的差值服从卡方分布
(3)确定P值,作出推论
案 例
卡方值的矫正
(1)若n > 40 ,此时有 1< t="">
(2)T
SPSS实现卡方检验
结果解读
3、常用等级资料假设检验方法
五、变量间关系研究
临床研究中,经常需要分析某些因素与疾病之间的关系,探讨疾病的危险因素。这些通常会涉及到多变量分析。
回归主要应用
1、筛选危险因素:单因素分析
2、矫正混杂因素:多因素分析
血浆miR-124-3p和miR-16是急性脑卒中的预后指标
六、常见统计学应用问题
1、近几十年,国内外经常有人调查公开发表的医药卫生论文中的统计学错误。出现错误的频繁程度并不随时间下降。
2、粗略地估计,70%左右的文章有统计学错误;其中,70%的错误出在初等的、基本的统计学方法;30%的错误出在高等的、复杂的统计学方法。
——方积乾 主编 卫生统计学(2012 第七版)
医学工作者误用和滥用统计学的原因
1、医学研究往往涉及到多因素、多指标的实验设计和多元统计分析方法,这些内容对于非统计工作者较难接受和掌握。
2、对医学科研工作,业务主管部门只是在宏观上提一些要求,缺乏具有权威性和可操作性的统计学应用指导。
3、把统计学看作是“技术问题”,认为其仅仅是对论文的修饰,用得正确与否不影响论文发表、成果审批”等误解
4、严格按统计学要求办事比较繁琐,人们习惯于长期形成的各自的做法。
常见统计学应用问题
1、统计描述错误
2、缺少统计分析
3、未说明统计分析方法
4、未设对照组
5、未考虑统计方法的条件
6、 检验代替方差分析
7、忽视重复测量特性
8、相关分析不考虑实际意义
9、仅看统计结果,无视专业意义
10、对P值含义理解错误
11、其他格式问题
统计描述错误
(1)未检验资料是否为正态,直接用均数和标准差描述资料
(2)图表格式问题:未采用三线表、图标题位置错误
缺少统计分析
因此认为该新药是否值得推广
缺乏假设检验及临床优效性检验
未说明统计分析方法
论文中使用了统计分析, 但未说明使用的是什么统计分析方法。表现为论文中只有P值, 但无法判断检验方法和统计量的大小。读者无法对文中应用的统计方法的正确性进行评价。
未考虑统计方法的条件
每一种统计方法都要求满足一定的前提条件,如t检验要求资料正态分布且组间方差齐。但不少论文中的资料明显呈偏态分布或方差不齐, 也使用t检验
t检验代替方差分析
将各种实验设计类型一律视为多个单因素两水平设计,重复用t检验进行均数之间的两两比较以取代方差分析,结果是错误结论明显增加。
用t检验与方差分析处理(实例)资料的区别
注:自由度大,所对应的统计量的可靠性就高,它相当于“权重”,也类似于产生“代表”的基数,基数越大,所选出的“代表”就越具有权威性。
忽略重复测量特性
重复测量是指对同一试验对象的某些观察指标在部分条件改变的前提下, 进行多次重复观察。这种数据在医学研究中十分常见。对于这种数据的统计分析, 常误用一般的方差分析。
由于一般的方差分析要求数据之间相互独立, 不存在相关性, 而重复资料不能满足这一要求, 故应采用重复测量设计资料的方差分析。
患者手术前后症状评分 (g=2)
其他格式问题——中华预防医学会系列杂志编排规范
小 结
理 解 统 计 基 本 概 念
严 格 进 行 统 计 设 计
正 确 选 择 统 计 方 法
规 范 描 述 统 计 结 果
有话要说...