APP下載

掃一掃,立即下載

醫(yī)學教育網(wǎng)APP下載

開發(fā)者:1

蘋果版本:1

安卓版本:1

應用涉及權限:查看權限 >

APP:隱私政策:查看政策 >

微 信
醫(yī)學教育網(wǎng)微信公號

官方微信Yishimed66

24小時客服電話:010-82311666

論文撰寫中常見的統(tǒng)計學問題及其處理

2007-06-19 16:09 醫(yī)學教育網(wǎng)
|

熱點推薦

——●●●聚焦熱點●●●——
報名預約>> 有問必答>> 報考測評>>

  絕大多數(shù)的論文撰寫,均需通過一定數(shù)量臨床病例(或資料)的觀察,研究事物間的相互關系,以探討客觀存在的新規(guī)律。如確定新診斷、新治療等措施是否優(yōu)于原沿用的方法,就需進行兩種方法比較,這就涉及統(tǒng)計處理;統(tǒng)計設計又是整個課題研究設計中一個重要的組成部分。顯然,經(jīng)正確統(tǒng)計處理的結(jié)果可信度高,論文的質(zhì)量也高。

  據(jù)不完全統(tǒng)計,在難以發(fā)表的、已凝聚著作者心血并花費較長時間與較大財力撰寫的研究論文中,約半數(shù)以上是由于統(tǒng)計錯誤致其結(jié)果與原文主要結(jié)論相違背。如一文采用某新藥引產(chǎn),96例足月孕婦的產(chǎn)后出血與新生兒低Apgar評分率均為2.1%(各2例),明顯低于應用原藥引產(chǎn)的19例,其產(chǎn)后出血與新生兒低Apgar評分發(fā)生率均為15.8%(各3例,χ2=7.164,P<0.005)。故認為采用新藥引產(chǎn)是一更安全的措施。原藥引產(chǎn)組例數(shù)偏少暫且不談,該資料比較應采用精確法分析,結(jié)果是與原結(jié)果恰恰相反(P>0.06),這樣上述的主要結(jié)論就欠可靠而難以發(fā)表,否則論文可起誤導作用。類似問題文稿中還常有出現(xiàn)。現(xiàn)就文稿中常見的統(tǒng)計問題及其相應的處理方法簡述如下。

  一、 常用的統(tǒng)計術語

  統(tǒng)計學中常用的概念有總體與樣本、隨機化與概率、計量與計數(shù)、等級資料及正態(tài)與偏態(tài)分布資料、標準差與標準誤等。如某研究采用經(jīng)會陰途徑測定宮頸長度,以探討不同宮頸長度與臨產(chǎn)時間的關系。結(jié)果顯示35例宮頸長度為25~34mm者與32例宮頸長為15~24mm者臨產(chǎn)時間的均值±標準差(x±s)各為57.6±58.1與47.3±49.1小時。該計量資料,經(jīng)t檢驗顯示t=0.780,P>0.06,并未提示不同宮頸長度的臨產(chǎn)時間差異有顯著意義;從標準差大于均值,顯示各變量值離散程度大,呈偏態(tài)分布,故不能采用x±s這一算術均數(shù)法計算均數(shù)。經(jīng)偏態(tài)轉(zhuǎn)換成近似正態(tài)分布資料后結(jié)果是:35例與32例的臨產(chǎn)時間各為34.5±4.1與26.7±4.1小時,(t=7.778,P<0.005),兩組差異有極顯著意義??烧J為隨著宮頸長度的縮短、臨產(chǎn)時間也縮短。此外,當兩組資料單位不同時,其S單位也不同;即使兩組單位相同的變量值,若其均數(shù)差異較大,也都應以變異系數(shù)替代s來比較兩組值的離散度的大小。

  二、 正常值范圍及異常閾值的確定

  如何選擇研究對象,至少需多少例,正確統(tǒng)計處理和參考一定數(shù)量的病例數(shù)據(jù),是確定正常值范圍及異常閾值的四個重要因素。

  1.研究對象:應為“完全健康者”,可包括患有不影響待測指標疾病的患者。如“正常妊娠”的條件:孕前月經(jīng)周期規(guī)則、單胎、妊娠過程順利、無產(chǎn)科并發(fā)癥及其它有關合并癥,分娩孕周為37~41周+6,新生兒出生體重為2500~4000g和Apgar評分≥7分。[醫(yī)學教育 網(wǎng) 搜集整理]

  2.觀察數(shù)量:觀察數(shù)量應盡可能多于100例;需分組者,各組人數(shù)也是如此(標本來源困難時酌情減少)。有些指標值如雌三醇(E3)、甲胎蛋白(AFP)、胎盤泌乳素(HPL)等隨孕周進展而變化,應按孕周分組;鄰近孕周均數(shù)相近者,可合并幾周計算。若為偏態(tài)分布,應以百分位數(shù)計算,則例數(shù)應≥120例。取各孕周對象時,應考慮到所取各孕周中的例數(shù)分布大致均衡。顯然,文稿中往往以少量例數(shù)求得正常值是欠可靠的。

  3.統(tǒng)計處理:應根據(jù)所得數(shù)據(jù)分布特征采用不同的統(tǒng)計處理方法。屬正態(tài)或近似正態(tài)分布的數(shù)據(jù),可采用x±s法計算;這也適用于以一定方法能將非正態(tài)分布轉(zhuǎn)換成正態(tài)或近似正態(tài)分布的資料。對無法轉(zhuǎn)換的偏態(tài)資料,應采用百分位數(shù)計算法。具體計算(包括上下限初步制定)見文獻。

  4.對照數(shù)量:相應觀察的病例數(shù)(包括分組)應不少于30例,這對制定某指標有臨床意義的異常閾值尤其重要,這一點往往易被忽視。如在參考較多病例數(shù)據(jù)后,唾液游離E3的下限異常閾值應為第2.5百分位數(shù),而非通常采用的5百分位數(shù)。否則,將會導致該指標產(chǎn)前監(jiān)護的假陽性率增加。

  三、 t檢驗與校正t檢驗(t′檢驗)

  這是文稿中極易混淆的一類計量資料統(tǒng)計問題。

 ?。ㄒ唬z驗的注意事項1.t檢驗的意義:t檢驗與所有統(tǒng)計分析相同,其結(jié)果提示現(xiàn)有差別不僅僅是抽樣誤差所致,且提示犯第一類錯誤的可能性大小,即t0.06與t0.05犯第一類錯誤的可能性各為5%與1%. 2.統(tǒng)計意義與臨床意義的關系:統(tǒng)計學有顯著意義,而在臨床上可能是無意義的,提示該研究應繼續(xù)深入,以明確該差異是否真有顯著意義;相反,統(tǒng)計無顯著意義,而臨床上卻是有意義的,不能貿(mào)然輕易地下結(jié)論。應復查實驗設計、方法、試劑及儀器性能、質(zhì)控措施和實驗數(shù)據(jù)等是否有問題,或尚需再進一步增加樣本量進行復測等。

  3.t檢驗適用范圍:t檢驗僅適用于正態(tài)或近似正態(tài)分布(包括偏態(tài)轉(zhuǎn)換)和其方差是齊性資料的檢驗;t檢驗適用于可比性資料,即除了欲比較的因素外,其它所有可影響的因素應相似。

  4.t檢驗的結(jié)果判斷:判斷結(jié)果不應絕對化,P<或>0.06,分別表示可拒絕或接受原定的假設,但兩者都有5%的可能性犯第一類錯誤;而P值越小,只能是更有理由拒絕原定的假設。

  5.單側(cè)與雙側(cè)檢驗:應預先制定本研究的結(jié)果是需行雙側(cè)還是單側(cè)檢驗。對有把握確知某治療措施或某指標是不會劣于現(xiàn)有的,才作單側(cè)檢驗;若不知何者為優(yōu),應行雙側(cè)檢驗。因為在同一t值的界限上,單側(cè)檢驗的概率(P)僅為后者的一半,也就是說單側(cè)檢驗較雙側(cè)檢驗更易得出差別有統(tǒng)計意義的結(jié)論,不可隨意制定。一般講,絕大多數(shù)研究以采用雙側(cè)檢驗為妥。

 ?。ǘ﹖′檢驗與t檢驗的區(qū)別當兩樣本均數(shù)的方差非齊性時,應以t′替代t檢驗。例如:甲組32例血清某指標值為53.9±49.6(μmol/L);乙組6例的結(jié)果為26.6±7.2(μmol/L),若不考慮兩樣本方差大小,t檢驗示t=1.331,P>0.06,提示兩組血清該指標的平均含量差異無顯著意義。但先作方差齊性檢驗,F(xiàn)=47.4,P<0.05,示這兩樣本方差差異有極顯著意義。據(jù)此應采用t′檢驗,t′=2.952>t′0.052.875,P<0.05.顯然,與上述結(jié)論恰恰相反。

  四、 卡方(χ2)、校正χ2與直接概率法(或精確法)檢驗

  這三種檢驗方法為一類用途較廣、但也易混淆的、適用于計數(shù)資料檢驗的方法。應注意,鑒于總數(shù)與理論值的不同,應采用相適合的檢驗方法。

  例1.192例出生體重≥4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為151例與22例;3475例出生體重≥3500~4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為185與265例;2451例出生體重≥2500~3500g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為122與169例。3組的構成比:難產(chǎn)與新生兒窒息率分別為:78.6%、5.3%、5.0%與11.4%、7.6%、6.9%.據(jù)此貿(mào)然認為出生體重≥2500~3500g為最佳新生兒分娩體重的結(jié)論是不可靠的。經(jīng)χ2分析,后兩組的難產(chǎn)與窒息率間和前兩組窒息率間差異均無顯著意義(P均>0.06)。故可認為,單據(jù)本研究結(jié)果是難以得出上述臨床上認可的結(jié)論的。這涉及到上述“統(tǒng)計無顯著意義,而臨床卻是有意義”的問題,應進一步復查或增加樣本測試。杜絕單純根據(jù)百分率的大小貿(mào)然下結(jié)論。

  例2.某藥治療感染衣原體(CT)的中、晚期孕婦各11例和36例,她們的新生兒感染CT數(shù)各為3例和23例。χ2檢驗得χ2=4.570,P<0.06.據(jù)此誤認為,某藥治療中孕期感染CT孕婦的新生兒感染CT數(shù)少于晚孕期才開始治療的新生兒感染數(shù)。根據(jù)統(tǒng)計原則,其中一個數(shù)的理論值為4.9(<5)時,應采用校正χ2計算,得χ2=3.209,P>0.06.顯然,正確結(jié)論恰與上述相異。

  例3.以精確法替代χ2檢驗。某新技術測試8例卵巢內(nèi)胚竇瘤患者,5例呈陽性反應;測試25例卵巢顆粒細胞瘤患者中6例陽性。χ2檢驗得χ2=4.062,P<0.06.誤認為該新技術測前組的陽性率高于后組。但鑒于總例數(shù)33例(<40),且其中一個數(shù)的理論值為2.7(<5),故應改用精確法檢驗,結(jié)果首次計算P值,已達0.105,>雙側(cè)檢驗的有顯著性意義的界限0.055,故P>0.06.結(jié)論也恰相反。[醫(yī)學教 育網(wǎng) 搜集整理]

  五、 相關與回歸分析

  相關分析只是以相關系數(shù)(r)來表示兩個變量間直線關系的密切程度和相關方面的統(tǒng)計指標。無論是正相關(r為正值)或負相關(r為負值),只是經(jīng)相關系數(shù)的統(tǒng)計意義檢驗(如t檢驗)后,當P<0.06時,即示差異有顯著意義時,才能依據(jù)|r|值的大小來說明兩變量間相關的密切程度。因此,表示相關性,除寫出r值外,應注明P值;切不可將相關的顯著性誤解為相關程度;也應注意:相關分析是不能單純用于闡明兩事物或現(xiàn)象間存在著本質(zhì)的聯(lián)系,即使兩變量間存在高度相關關系(即有一定的統(tǒng)計聯(lián)系),也不能證明它們間存在著因果關系。如欲證明兩事物間的內(nèi)在聯(lián)系,必需憑借專業(yè)知識從理論上加以闡明。

  “相關”是表示兩個變量間相互關系的密切程度,而回歸分析是提示兩個變量間的從屬關系。在回歸分析中,應注意由X變量值推算Y,與以Y變量值推算X的回歸線是不一樣的;直線回歸方程的適用范圍,一般僅適合于自變量X原測數(shù)據(jù)的范圍,故繪制回歸線時,X值切不能超越實測值的范圍而任意延長。

  可見,這兩種分析,說明的問題是不同的,但相互又有聯(lián)系。在作回歸分析時,一般先作相關分析,只有在相關分析有統(tǒng)計意義(即回歸有統(tǒng)計意義)的前提下,求回歸方程和回歸線才有實際意義。決不能把毫無實際意義的兩個事物或兩種現(xiàn)象進行相關與回歸分析。

  六、 數(shù)據(jù)的正確書寫

  1.文稿內(nèi)各數(shù)據(jù)的書寫必須前后一致;總數(shù)應等于各分組的數(shù)據(jù)之和。

  2.對不同指標,有其不同數(shù)據(jù)精度的要求,這應結(jié)合專業(yè)知識加以判斷。如新生兒出生體重是以公斤為單位,記錄測定數(shù)據(jù)精確到小數(shù)點后的第二位數(shù)字即可。

  3.測定數(shù)據(jù)的書寫,不能超越其測量儀器測試的精確度范圍。

  4.同一指標的前后數(shù)據(jù)應保持同一精確度。

  5.經(jīng)計算,出現(xiàn)比預定小數(shù)點后兩位數(shù)多的數(shù)字,應采取“≤4舍、≥6入”與“5‘奇’進‘偶’出”方法,以決定小數(shù)點后第三位數(shù)字是“舍”還是“入”,即5前為單數(shù)則入,雙數(shù)則舍。

  6.未經(jīng)統(tǒng)計檢驗,文稿內(nèi)不宜出現(xiàn)推斷性的比較結(jié)果的結(jié)論。如“××結(jié)果的百分率高或低于××結(jié)果的百分率”、“本文結(jié)果較××報道的多或少或類似”等結(jié)論。這在綜述類文章撰寫過程中也需注意;欲予以比較,也應注意兩者的可比性。

  上述是統(tǒng)計學中較為基礎的概念,但又是文稿中常見的、較易出現(xiàn)差錯的內(nèi)容。因此可以認為,統(tǒng)計學是醫(yī)護人員必需掌握并能熟練應用的一門重要知識;藉此,可不斷地從自身和他人的研究中獲取更多、更新和更可靠的專業(yè)信息。

執(zhí)業(yè)醫(yī)師考試公眾號

折疊
您有一次專屬抽獎機會
可優(yōu)惠~
領取
優(yōu)惠
注:具體優(yōu)惠金額根據(jù)商品價格進行計算
恭喜您獲得張優(yōu)惠券!
去選課
已存入賬戶 可在【我的優(yōu)惠券】中查看