論文撰寫(xiě)中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題及其處理

2007-06-19 16:09 來(lái)源：

打印

字體：大小

　　絕大多數(shù)的論文撰寫(xiě)，均需通過(guò)一定數(shù)量臨床病例（或資料）的觀察，研究事物間的相互關(guān)系，以探討客觀存在的新規(guī)律。如確定新診斷、新治療等措施是否優(yōu)于原沿用的方法，就需進(jìn)行兩種方法比較，這就涉及統(tǒng)計(jì)處理；統(tǒng)計(jì)設(shè)計(jì)又是整個(gè)課題研究設(shè)計(jì)中一個(gè)重要的組成部分。顯然，經(jīng)正確統(tǒng)計(jì)處理的結(jié)果可信度高，論文的質(zhì)量也高。

　　據(jù)不完全統(tǒng)計(jì)，在難以發(fā)表的、已凝聚著作者心血并花費(fèi)較長(zhǎng)時(shí)間與較大財(cái)力撰寫(xiě)的研究論文中，約半數(shù)以上是由于統(tǒng)計(jì)錯(cuò)誤致其結(jié)果與原文主要結(jié)論相違背。如一文采用某新藥引產(chǎn)，96例足月孕婦的產(chǎn)后出血與新生兒低Apgar評(píng)分率均為2.1%（各2例），明顯低于應(yīng)用原藥引產(chǎn)的19例，其產(chǎn)后出血與新生兒低Apgar評(píng)分發(fā)生率均為15.8%（各3例，χ2=7.164，P<0.005）。故認(rèn)為采用新藥引產(chǎn)是一更安全的措施。原藥引產(chǎn)組例數(shù)偏少暫且不談，該資料比較應(yīng)采用精確法分析，結(jié)果是與原結(jié)果恰恰相反（P>0.06），這樣上述的主要結(jié)論就欠可靠而難以發(fā)表，否則論文可起誤導(dǎo)作用。類(lèi)似問(wèn)題文稿中還常有出現(xiàn)?，F(xiàn)就文稿中常見(jiàn)的統(tǒng)計(jì)問(wèn)題及其相應(yīng)的處理方法簡(jiǎn)述如下。

　　一、常用的統(tǒng)計(jì)術(shù)語(yǔ)

　　統(tǒng)計(jì)學(xué)中常用的概念有總體與樣本、隨機(jī)化與概率、計(jì)量與計(jì)數(shù)、等級(jí)資料及正態(tài)與偏態(tài)分布資料、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤等。如某研究采用經(jīng)會(huì)陰途徑測(cè)定宮頸長(zhǎng)度，以探討不同宮頸長(zhǎng)度與臨產(chǎn)時(shí)間的關(guān)系。結(jié)果顯示35例宮頸長(zhǎng)度為25～34mm者與32例宮頸長(zhǎng)為15～24mm者臨產(chǎn)時(shí)間的均值±標(biāo)準(zhǔn)差（x±s）各為57.6±58.1與47.3±49.1小時(shí)。該計(jì)量資料，經(jīng)t檢驗(yàn)顯示t=0.780，P>0.06，并未提示不同宮頸長(zhǎng)度的臨產(chǎn)時(shí)間差異有顯著意義；從標(biāo)準(zhǔn)差大于均值，顯示各變量值離散程度大，呈偏態(tài)分布，故不能采用x±s這一算術(shù)均數(shù)法計(jì)算均數(shù)。經(jīng)偏態(tài)轉(zhuǎn)換成近似正態(tài)分布資料后結(jié)果是：35例與32例的臨產(chǎn)時(shí)間各為34.5±4.1與26.7±4.1小時(shí)，（t=7.778，P<0.005），兩組差異有極顯著意義?？烧J(rèn)為隨著宮頸長(zhǎng)度的縮短、臨產(chǎn)時(shí)間也縮短。此外，當(dāng)兩組資料單位不同時(shí)，其S單位也不同；即使兩組單位相同的變量值，若其均數(shù)差異較大，也都應(yīng)以變異系數(shù)替代s來(lái)比較兩組值的離散度的大小。

　　二、正常值范圍及異常閾值的確定

　　如何選擇研究對(duì)象，至少需多少例，正確統(tǒng)計(jì)處理和參考一定數(shù)量的病例數(shù)據(jù)，是確定正常值范圍及異常閾值的四個(gè)重要因素。

　　1.研究對(duì)象：應(yīng)為“完全健康者”，可包括患有不影響待測(cè)指標(biāo)疾病的患者。如“正常妊娠”的條件：孕前月經(jīng)周期規(guī)則、單胎、妊娠過(guò)程順利、無(wú)產(chǎn)科并發(fā)癥及其它有關(guān)合并癥，分娩孕周為37～41周+6，新生兒出生體重為2500～4000g和Apgar評(píng)分≥7分。［醫(yī)學(xué)教育網(wǎng) 搜集整理］

　　2.觀察數(shù)量：觀察數(shù)量應(yīng)盡可能多于100例；需分組者，各組人數(shù)也是如此（標(biāo)本來(lái)源困難時(shí)酌情減少）。有些指標(biāo)值如雌三醇（E3）、甲胎蛋白（AFP）、胎盤(pán)泌乳素（HPL）等隨孕周進(jìn)展而變化，應(yīng)按孕周分組；鄰近孕周均數(shù)相近者，可合并幾周計(jì)算。若為偏態(tài)分布，應(yīng)以百分位數(shù)計(jì)算，則例數(shù)應(yīng)≥120例。取各孕周對(duì)象時(shí)，應(yīng)考慮到所取各孕周中的例數(shù)分布大致均衡。顯然，文稿中往往以少量例數(shù)求得正常值是欠可靠的。

　　3.統(tǒng)計(jì)處理：應(yīng)根據(jù)所得數(shù)據(jù)分布特征采用不同的統(tǒng)計(jì)處理方法。屬正態(tài)或近似正態(tài)分布的數(shù)據(jù)，可采用x±s法計(jì)算；這也適用于以一定方法能將非正態(tài)分布轉(zhuǎn)換成正態(tài)或近似正態(tài)分布的資料。對(duì)無(wú)法轉(zhuǎn)換的偏態(tài)資料，應(yīng)采用百分位數(shù)計(jì)算法。具體計(jì)算（包括上下限初步制定）見(jiàn)文獻(xiàn)。

　　4.對(duì)照數(shù)量：相應(yīng)觀察的病例數(shù)（包括分組）應(yīng)不少于30例，這對(duì)制定某指標(biāo)有臨床意義的異常閾值尤其重要，這一點(diǎn)往往易被忽視。如在參考較多病例數(shù)據(jù)后，唾液游離E3的下限異常閾值應(yīng)為第2.5百分位數(shù)，而非通常采用的5百分位數(shù)。否則，將會(huì)導(dǎo)致該指標(biāo)產(chǎn)前監(jiān)護(hù)的假陽(yáng)性率增加。

　　三、 t檢驗(yàn)與校正t檢驗(yàn)（t′檢驗(yàn)）

　　這是文稿中極易混淆的一類(lèi)計(jì)量資料統(tǒng)計(jì)問(wèn)題。

　　（一）檢驗(yàn)的注意事項(xiàng)1.t檢驗(yàn)的意義：t檢驗(yàn)與所有統(tǒng)計(jì)分析相同，其結(jié)果提示現(xiàn)有差別不僅僅是抽樣誤差所致，且提示犯第一類(lèi)錯(cuò)誤的可能性大小，即t0.06與t0.05犯第一類(lèi)錯(cuò)誤的可能性各為5%與1%. 2.統(tǒng)計(jì)意義與臨床意義的關(guān)系：統(tǒng)計(jì)學(xué)有顯著意義，而在臨床上可能是無(wú)意義的，提示該研究應(yīng)繼續(xù)深入，以明確該差異是否真有顯著意義；相反，統(tǒng)計(jì)無(wú)顯著意義，而臨床上卻是有意義的，不能貿(mào)然輕易地下結(jié)論。應(yīng)復(fù)查實(shí)驗(yàn)設(shè)計(jì)、方法、試劑及儀器性能、質(zhì)控措施和實(shí)驗(yàn)數(shù)據(jù)等是否有問(wèn)題，或尚需再進(jìn)一步增加樣本量進(jìn)行復(fù)測(cè)等。

　　3.t檢驗(yàn)適用范圍：t檢驗(yàn)僅適用于正態(tài)或近似正態(tài)分布（包括偏態(tài)轉(zhuǎn)換）和其方差是齊性資料的檢驗(yàn)；t檢驗(yàn)適用于可比性資料，即除了欲比較的因素外，其它所有可影響的因素應(yīng)相似。

　　4.t檢驗(yàn)的結(jié)果判斷：判斷結(jié)果不應(yīng)絕對(duì)化，P<或>0.06，分別表示可拒絕或接受原定的假設(shè)，但兩者都有5%的可能性犯第一類(lèi)錯(cuò)誤；而P值越小，只能是更有理由拒絕原定的假設(shè)。

　　5.單側(cè)與雙側(cè)檢驗(yàn)：應(yīng)預(yù)先制定本研究的結(jié)果是需行雙側(cè)還是單側(cè)檢驗(yàn)。對(duì)有把握確知某治療措施或某指標(biāo)是不會(huì)劣于現(xiàn)有的，才作單側(cè)檢驗(yàn)；若不知何者為優(yōu)，應(yīng)行雙側(cè)檢驗(yàn)。因?yàn)樵谕籺值的界限上，單側(cè)檢驗(yàn)的概率（P）僅為后者的一半，也就是說(shuō)單側(cè)檢驗(yàn)較雙側(cè)檢驗(yàn)更易得出差別有統(tǒng)計(jì)意義的結(jié)論，不可隨意制定。一般講，絕大多數(shù)研究以采用雙側(cè)檢驗(yàn)為妥。

　　（二）t′檢驗(yàn)與t檢驗(yàn)的區(qū)別當(dāng)兩樣本均數(shù)的方差非齊性時(shí)，應(yīng)以t′替代t檢驗(yàn)。例如：甲組32例血清某指標(biāo)值為53.9±49.6（μmol/L）；乙組6例的結(jié)果為26.6±7.2（μmol/L），若不考慮兩樣本方差大小，t檢驗(yàn)示t=1.331，P>0.06，提示兩組血清該指標(biāo)的平均含量差異無(wú)顯著意義。但先作方差齊性檢驗(yàn)，F(xiàn)=47.4，P<0.05，示這兩樣本方差差異有極顯著意義。據(jù)此應(yīng)采用t′檢驗(yàn)，t′=2.952>t′0.052.875，P<0.05.顯然，與上述結(jié)論恰恰相反。

　　四、卡方（χ2）、校正χ2與直接概率法（或精確法）檢驗(yàn)

　　這三種檢驗(yàn)方法為一類(lèi)用途較廣、但也易混淆的、適用于計(jì)數(shù)資料檢驗(yàn)的方法。應(yīng)注意，鑒于總數(shù)與理論值的不同，應(yīng)采用相適合的檢驗(yàn)方法。

　　例1.192例出生體重≥4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為151例與22例；3475例出生體重≥3500～4000g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為185與265例；2451例出生體重≥2500～3500g的新生兒發(fā)生難產(chǎn)與窒息數(shù)分別為122與169例。3組的構(gòu)成比：難產(chǎn)與新生兒窒息率分別為：78.6%、5.3%、5.0%與11.4%、7.6%、6.9%.據(jù)此貿(mào)然認(rèn)為出生體重≥2500～3500g為最佳新生兒分娩體重的結(jié)論是不可靠的。經(jīng)χ2分析，后兩組的難產(chǎn)與窒息率間和前兩組窒息率間差異均無(wú)顯著意義（P均>0.06）。故可認(rèn)為，單據(jù)本研究結(jié)果是難以得出上述臨床上認(rèn)可的結(jié)論的。這涉及到上述“統(tǒng)計(jì)無(wú)顯著意義，而臨床卻是有意義”的問(wèn)題，應(yīng)進(jìn)一步復(fù)查或增加樣本測(cè)試。杜絕單純根據(jù)百分率的大小貿(mào)然下結(jié)論。

　　例2.某藥治療感染衣原體（CT）的中、晚期孕婦各11例和36例，她們的新生兒感染CT數(shù)各為3例和23例。χ2檢驗(yàn)得χ2=4.570，P<0.06.據(jù)此誤認(rèn)為，某藥治療中孕期感染CT孕婦的新生兒感染CT數(shù)少于晚孕期才開(kāi)始治療的新生兒感染數(shù)。根據(jù)統(tǒng)計(jì)原則，其中一個(gè)數(shù)的理論值為4.9（<5）時(shí)，應(yīng)采用校正χ2計(jì)算，得χ2=3.209，P>0.06.顯然，正確結(jié)論恰與上述相異。

　　例3.以精確法替代χ2檢驗(yàn)。某新技術(shù)測(cè)試8例卵巢內(nèi)胚竇瘤患者，5例呈陽(yáng)性反應(yīng)；測(cè)試25例卵巢顆粒細(xì)胞瘤患者中6例陽(yáng)性。χ2檢驗(yàn)得χ2=4.062，P<0.06.誤認(rèn)為該新技術(shù)測(cè)前組的陽(yáng)性率高于后組。但鑒于總例數(shù)33例（<40），且其中一個(gè)數(shù)的理論值為2.7（<5），故應(yīng)改用精確法檢驗(yàn)，結(jié)果首次計(jì)算P值，已達(dá)0.105，>雙側(cè)檢驗(yàn)的有顯著性意義的界限0.055，故P>0.06.結(jié)論也恰相反。［醫(yī)學(xué)教育網(wǎng) 搜集整理］

　　五、相關(guān)與回歸分析

　　相關(guān)分析只是以相關(guān)系數(shù)（r）來(lái)表示兩個(gè)變量間直線(xiàn)關(guān)系的密切程度和相關(guān)方面的統(tǒng)計(jì)指標(biāo)。無(wú)論是正相關(guān)（r為正值）或負(fù)相關(guān)（r為負(fù)值），只是經(jīng)相關(guān)系數(shù)的統(tǒng)計(jì)意義檢驗(yàn)（如t檢驗(yàn)）后，當(dāng)P<0.06時(shí)，即示差異有顯著意義時(shí)，才能依據(jù)|r|值的大小來(lái)說(shuō)明兩變量間相關(guān)的密切程度。因此，表示相關(guān)性，除寫(xiě)出r值外，應(yīng)注明P值；切不可將相關(guān)的顯著性誤解為相關(guān)程度；也應(yīng)注意：相關(guān)分析是不能單純用于闡明兩事物或現(xiàn)象間存在著本質(zhì)的聯(lián)系，即使兩變量間存在高度相關(guān)關(guān)系（即有一定的統(tǒng)計(jì)聯(lián)系），也不能證明它們間存在著因果關(guān)系。如欲證明兩事物間的內(nèi)在聯(lián)系，必需憑借專(zhuān)業(yè)知識(shí)從理論上加以闡明。

　　“相關(guān)”是表示兩個(gè)變量間相互關(guān)系的密切程度，而回歸分析是提示兩個(gè)變量間的從屬關(guān)系。在回歸分析中，應(yīng)注意由X變量值推算Y，與以Y變量值推算X的回歸線(xiàn)是不一樣的；直線(xiàn)回歸方程的適用范圍，一般僅適合于自變量X原測(cè)數(shù)據(jù)的范圍，故繪制回歸線(xiàn)時(shí)，X值切不能超越實(shí)測(cè)值的范圍而任意延長(zhǎng)。

　　可見(jiàn)，這兩種分析，說(shuō)明的問(wèn)題是不同的，但相互又有聯(lián)系。在作回歸分析時(shí)，一般先作相關(guān)分析，只有在相關(guān)分析有統(tǒng)計(jì)意義（即回歸有統(tǒng)計(jì)意義）的前提下，求回歸方程和回歸線(xiàn)才有實(shí)際意義。決不能把毫無(wú)實(shí)際意義的兩個(gè)事物或兩種現(xiàn)象進(jìn)行相關(guān)與回歸分析。

　　六、數(shù)據(jù)的正確書(shū)寫(xiě)

　　1.文稿內(nèi)各數(shù)據(jù)的書(shū)寫(xiě)必須前后一致；總數(shù)應(yīng)等于各分組的數(shù)據(jù)之和。

　　2.對(duì)不同指標(biāo)，有其不同數(shù)據(jù)精度的要求，這應(yīng)結(jié)合專(zhuān)業(yè)知識(shí)加以判斷。如新生兒出生體重是以公斤為單位，記錄測(cè)定數(shù)據(jù)精確到小數(shù)點(diǎn)后的第二位數(shù)字即可。

　　3.測(cè)定數(shù)據(jù)的書(shū)寫(xiě)，不能超越其測(cè)量?jī)x器測(cè)試的精確度范圍。

　　4.同一指標(biāo)的前后數(shù)據(jù)應(yīng)保持同一精確度。

　　5.經(jīng)計(jì)算，出現(xiàn)比預(yù)定小數(shù)點(diǎn)后兩位數(shù)多的數(shù)字，應(yīng)采取“≤4舍、≥6入”與“5‘奇’進(jìn)‘偶’出”方法，以決定小數(shù)點(diǎn)后第三位數(shù)字是“舍”還是“入”，即5前為單數(shù)則入，雙數(shù)則舍。

　　6.未經(jīng)統(tǒng)計(jì)檢驗(yàn)，文稿內(nèi)不宜出現(xiàn)推斷性的比較結(jié)果的結(jié)論。如“××結(jié)果的百分率高或低于××結(jié)果的百分率”、“本文結(jié)果較××報(bào)道的多或少或類(lèi)似”等結(jié)論。這在綜述類(lèi)文章撰寫(xiě)過(guò)程中也需注意；欲予以比較，也應(yīng)注意兩者的可比性。

　　上述是統(tǒng)計(jì)學(xué)中較為基礎(chǔ)的概念，但又是文稿中常見(jiàn)的、較易出現(xiàn)差錯(cuò)的內(nèi)容。因此可以認(rèn)為，統(tǒng)計(jì)學(xué)是醫(yī)護(hù)人員必需掌握并能熟練應(yīng)用的一門(mén)重要知識(shí)；藉此，可不斷地從自身和他人的研究中獲取更多、更新和更可靠的專(zhuān)業(yè)信息。

題庫(kù)小程序