編者按:
精選課件
醫學科研中常用統計方法及錯誤解析
李連紅 博士南京醫科大學第二附屬醫院 感染管理科
一篇優秀的醫學論文應該具備:
案例
降鈣素原對成人下呼吸道感染
診斷價值的研究
中華檢驗醫學雜志 2011,34(12):1069-72
通常認為血清降鈣素原(PCT)能更好的提示全身性細菌感染或膿毒症,但有研究發現膿毒症患者PCT波動範圍較大,甚至可能低于0.5mg/l。那麼若想探讨降鈣素原在成人下呼吸道感染中的診斷價值。
1、如何設計?
2、要搜集多少樣本?
3、應采用什麼樣的指标來反映其診斷價值?
4、搜集數據後用什麼方法分析?怎麼實現?
衛生統計學将回答上述問題!
一、統計學在醫學科研中作用
1、統計學是進行醫學科研的重要工具
2、滿足統計學原則要求是保障醫學科研科學性的前提
3、采用恰當的統計學方法是研究結論可靠、可信的前提
4、課題申報、論文撰寫均有明确的統計學要求
二、合理選擇統計方法的四個因素
(一)研究設計
(二)分析目的
(三)資料類型
(四)數據特征
(一)研究設計
1、完全随機設計(成組設計)
——最常見,最易實施的實驗設計方案
——将研究對象随機分配到幾個組,然後做實驗
2、配對設計(區組設計)
——将具有相似特征的研究對象配成對子,然後再将每個對子的對象随機分配到兩個組進行實驗
——例如,研究血液透析機的消毒效果,同一台機器同時采集2份标本,一份做細菌培養,一份做内毒素檢測
3、析因設計
——同時研究多個實驗因素對結果的影響
——例如,研究藥物劑量(3mg、6mg)及給藥方式(口服、肌注)對結果的影響,每種組合均需要做試驗(3mg+口服,3mg+肌注, 6mg+口服, 6mg+肌注),為2×2析因設計
4、重複測量設計
——同一對象在不同時間點上進行某個指标的觀測,以分析該指标在時間上的變化。
(二)分析目的
1、對臨床資料進行統計描述
描述性統計分析方法:如均數,中位數,标準差,百分比,頻數分布等
2、對幾組資料進行差異性檢驗
假設檢驗方法:如t檢驗,卡方檢驗,方差分析,秩和檢驗等
3、探讨變量之間的關系,或者自變量(影響因素)對應變量(結果變量)的影響大小
多變量分析:如線性相關,線性回歸,回歸,Cox回歸、生存分析等
(三)資料類型
臨床上數據資料分類:
1、計量資料,數值變量,每一個觀察對象都有一個數值,且大小差異有意義,如血壓、心率、年齡、尿量。
2、分類資料,屬性分類。
(1)無序分類:指類别或屬性間無順序、程度之分
例如:性别(男、女)為二分類
血型(A、B、AB、O)為多分類
(2)有序分類:指類别間存在着次序,或程度上的差異。
例如:治療效果:無效、好轉、顯效、治愈
實驗室檢驗:–、+、++、+++
(四)數據特征
1、任何統計方法都有自己的适用條件,隻有當某個或某些條件滿足時,統計計算公式才成立
2、适用條件可根據數據特征來判斷
——數據的分布特征(正态、偏态)
——方差齊性
——理論數(T)大小
——樣本量(n)大小
三、數據資料的描述
(一)數值變量資料的描述
重要的分布——正态分布( )
大量連續随機變量都符合正态分布。小樣本量需做K-S檢驗/S-W檢驗判斷是否符合正态分布。
正态性檢驗
正态性檢驗結果解讀
偏态分布形狀
右偏态:如血鉛含量、尿汞含量
左偏态:如肺活量
四分位數
- 下四分位數: 25 , P25
- 上四分位數: 75 , P75
四分位數間距: P75 - P25
方差齊性
方差是否齊同(相等)
粗略判斷
兩組标準差之比在2.5倍以上,就得警惕方差不齊
SPSS如何變量描述
(二)分類變量資料的描述
通常需要描述各個類别的頻數及頻率(百分比)
1、構成比:各類别在總數中的比重或百分比。
2、率:如果數據分為發生或不發生,如死亡、患病等,則可計算其死亡率、發病率等指标,表示其發生的強度。
3、比:相對比,是兩個有關指标之比。如男女性别比,醫護比,床護比
不能以構成比代替率的分析!
正确求平均率!
優勢比、相對危險度
1、優勢比(OR) 是在病例對照研究中表示疾病與暴露之間的聯系強度
2、相對危險度(RR) 是兩種暴露與非暴露組發病率之比,隊列研究(前瞻性研究)。
>1危險因素;
您能看懂這個圖嗎?
:降鈣素原診斷細菌性腦膜炎--外周血 vs 腦脊液
,2016,95(11):e3079)
SPSS實現分類變量資料的描述
結果解讀
四、數據資料的組間比較
根據資料類型選擇
1、計量資料的假設檢驗
t檢驗、F檢驗(方差分析)、Z檢驗、秩和檢驗(秩和檢驗、H檢驗、檢驗)等
2、計數資料的假設檢驗
卡方檢驗、Z檢驗等
3、等級資料的假設檢驗
秩和檢驗(秩和檢驗、H檢驗、檢驗)
1、常用計量資料假設檢驗方法
獨立樣本t檢驗
結果解讀
2、常用計數資料假設檢驗方法
卡方檢驗
卡方檢驗是以卡方分布為基礎的一種常用假設檢驗方法,主要用于分類變量
1、基本思想
(1)假設兩總體率相等
(2)實際數與理論數的差值服從卡方分布
(3)确定P值,作出推論
案 例
卡方值的矯正
(1)若n > 40 ,此時有 1< t="">
(2)T
SPSS實現卡方檢驗
結果解讀
3、常用等級資料假設檢驗方法
五、變量間關系研究
臨床研究中,經常需要分析某些因素與疾病之間的關系,探讨疾病的危險因素。這些通常會涉及到多變量分析。
回歸主要應用
1、篩選危險因素:單因素分析
2、矯正混雜因素:多因素分析
血漿miR-124-3p和miR-16是急性腦卒中的預後指标
六、常見統計學應用問題
1、近幾十年,國内外經常有人調查公開發表的醫藥衛生論文中的統計學錯誤。出現錯誤的頻繁程度并不随時間下降。
2、粗略地估計,70%左右的文章有統計學錯誤;其中,70%的錯誤出在初等的、基本的統計學方法;30%的錯誤出在高等的、複雜的統計學方法。
——方積乾 主編 衛生統計學(2012 第七版)
醫學工作者誤用和濫用統計學的原因
1、醫學研究往往涉及到多因素、多指标的實驗設計和多元統計分析方法,這些内容對于非統計工作者較難接受和掌握。
2、對醫學科研工作,業務主管部門隻是在宏觀上提一些要求,缺乏具有權威性和可操作性的統計學應用指導。
3、把統計學看作是“技術問題”,認為其僅僅是對論文的修飾,用得正确與否不影響論文發表、成果審批”等誤解
4、嚴格按統計學要求辦事比較繁瑣,人們習慣于長期形成的各自的做法。
常見統計學應用問題
1、統計描述錯誤
2、缺少統計分析
3、未說明統計分析方法
4、未設對照組
5、未考慮統計方法的條件
6、 檢驗代替方差分析
7、忽視重複測量特性
8、相關分析不考慮實際意義
9、僅看統計結果,無視專業意義
10、對P值含義理解錯誤
11、其他格式問題
統計描述錯誤
(1)未檢驗資料是否為正态,直接用均數和标準差描述資料
(2)圖表格式問題:未采用三線表、圖标題位置錯誤
缺少統計分析
因此認為該新藥是否值得推廣
缺乏假設檢驗及臨床優效性檢驗
未說明統計分析方法
論文中使用了統計分析, 但未說明使用的是什麼統計分析方法。表現為論文中隻有P值, 但無法判斷檢驗方法和統計量的大小。讀者無法對文中應用的統計方法的正确性進行評價。
未考慮統計方法的條件
每一種統計方法都要求滿足一定的前提條件,如t檢驗要求資料正态分布且組間方差齊。但不少論文中的資料明顯呈偏态分布或方差不齊, 也使用t檢驗
t檢驗代替方差分析
将各種實驗設計類型一律視為多個單因素兩水平設計,重複用t檢驗進行均數之間的兩兩比較以取代方差分析,結果是錯誤結論明顯增加。
用t檢驗與方差分析處理(實例)資料的區别
注:自由度大,所對應的統計量的可靠性就高,它相當于“權重”,也類似于産生“代表”的基數,基數越大,所選出的“代表”就越具有權威性。
忽略重複測量特性
重複測量是指對同一試驗對象的某些觀察指标在部分條件改變的前提下, 進行多次重複觀察。這種數據在醫學研究中十分常見。對于這種數據的統計分析, 常誤用一般的方差分析。
由于一般的方差分析要求數據之間相互獨立, 不存在相關性, 而重複資料不能滿足這一要求, 故應采用重複測量設計資料的方差分析。
患者手術前後症狀評分 (g=2)
其他格式問題——中華預防醫學會系列雜志編排規範
小 結
理 解 統 計 基 本 概 念
嚴 格 進 行 統 計 設 計
正 确 選 擇 統 計 方 法
規 範 描 述 統 計 結 果
有話要說...