發布時間:2022-05-03 18:45:18
序言:寫作是分享個人見解和探索未知領域的橋梁,我們為您精選了8篇的軍事醫學論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發,請盡情閱讀。
很多科研人員(包括臨床醫生)在進行科研工作過程中,習慣用專業知識取代一切其他知識。其突出表現是:等科研工作已經完成,甚至論文已寫完,因某些數據處理有問題被退稿時,才想起要找統計學工作者幫助處理論文中的實驗數據;考慮問題稍周到一些的科研人員在科研工作完成之后,在撰寫論文之前就想到要運用統計學知識來分析實驗數據。這兩種運用統計學的科研人員都是在把統計學當作分析數據的“計算工具”或當作發表學術論文的“敲門磚”,是對統計學重要性認識不足的突出表現。理由很簡單,科研數據是否正確可靠、是否值得進行數據分析、結論是否可信等一系列重要問題都沒有令人信服的證據來幫助說明,換句話說,若缺乏科研設計或科研設計不科學、不完善,即使花費10年時間和數億人民幣進行調查或實驗獲得了大量科研數據,與某人用計算機產生的毫無專業含義的任意多個隨機數據沒有什么區別,除了浪費了大量國家和人民的血汗錢,對科學技術進步、對人類的貢獻不僅為零,甚至是負數!因此,在進行科研工作之前,制定科學完善的科研設計方案,特別是其中的實驗設計方案或調查設計方案的質量好壞,是科研工作成敗的關鍵所在!
科研設計包括專業設計和統計研究設計。專業設計主要包括基本常識和專業知識的正確、全面、巧妙地運用;而統計研究設計包括實驗設計、臨床試驗設計和調查設計。值得注意的是:在很多科研人員所做的科研課題中,不僅嚴重忽視統計研究設計,就連專業設計也有嚴重錯誤,主要表現在犯了基本常識錯誤和違背專業知識錯誤。這類錯誤所發生的頻率還相當高,是一種不能容忍的不正常現象!
在統計研究設計所包含的3種研究設計中,實驗設計是最重要的,因為很多關鍵性的內容都包含在其中,其核心內容是“三要素”、“四原則”和“設計類型”。所謂“三要素”就是受試對象(或調查對象)、影響因素(包括試驗因素和重要的非試驗因素)和實驗效應(通過具體的觀測指標來體現);所謂“四原則”就是隨機、對照、重復和均衡原則,它們在選取和分配受試對象、控制重要非試驗因素對觀測結果的干擾和影響、提高組間均衡性、提高結論的可靠性和說服力等方面將起到“保駕護航”的作用;所謂“設計類型”就是實驗中因素及其水平如何合理搭配而形成的一種結構,它決定了能否多快好省且又經濟可靠地實現研究目標。科研人員若對重要非試驗因素考慮不周到、對照組選擇不合理、設計類型選擇不當或辨別不清,導致科研課題的科研設計千瘡百孔、數據分析濫竽充數、結果解釋稀里糊涂、結論陳述啼笑皆非。下面筆者就“實驗設計”環節存在的問題辨析如下。
1 在分析定量資料前未明確交代所對應的實驗設計類型
人們在處理定量資料前未明確交代定量資料所對應的實驗設計,對數千篇稿件進行審閱后發現,大多數人都是盲目套用統計分析方法,其結論的正確性如何是可想而知的。這是一條出現非常頻繁的錯誤,應當引起廣大科研工作者的高度重視。
2 臨床試驗設計中一個極易被忽視的問題——按重要非試驗因素進行分層隨機化
例1:原文題目為《氣管舒合劑治療支氣管哮喘的臨床觀察》。原作者寫到:“全部病例均來源于本院呼吸專科門診和普通門診,隨機分為治療組40例和對照組30例。其中治療組男21例,女19例;年齡21~55歲,平均(36.28±9.36)歲;病程2~23年,平均(10.31±17.48)年;病情輕度者16例,中度24例。對照組30例,男16例,女14例;年齡20~53歲,平均(35.78±9.53)歲;病程3~24年,平均(11.05±6.47)年;病情輕度者13例,中度者17例。兩組間情況差異無顯著性,具有可比性。”請問這樣隨機化,其組間具有可比性嗎?
對差錯的辨析與釋疑:顯然,研究者在試驗設計時未對重要非試驗因素采用分層隨機保證各組之間的可比性。這條錯誤的嚴重程度為不可逆,出現不可逆錯誤意味著原作者的試驗設計具有無法改正的錯誤,必須重做實驗!究其原因,主要是原作者未理解統計學上隨機的概念。統計學上隨機化的目的是盡可能去掉人為因素對觀測結果的干擾和影響,讓重要的非試驗因素在組間達到平衡。稍微留意一下原作者隨機化分組,明顯帶有人為的痕跡,治療組40人比對照組30人多出10人;治療組病程的標準差17.48是對照組病程的標準差6.47的近3倍。筆者很疑惑怎樣的隨機化才能達到如此的不平衡?事實上隨機化有4種:子總體內隨機、完全隨機、分層隨機和按不平衡指數最小原則所進行的隨機,原文條件下應當選用分層隨機,即以兩個重要的非試驗因素(性別和病情)水平組合形成4個小組(男輕,女輕,男中,女中),然后把每個小組內的患者再隨機均分到治療組和對照組中去,這樣分層隨機的最終結果一定是治療組和對照組各35人,且使2組間非試驗因素的影響達到盡可能的平衡,從而可大大提高組間的可比性。在本例中,若“病程”對觀測結果有重要影響,在進行分層隨機化時,在按“性別”和“病情”分組的基礎上,還應再按“病程”(設分為短、中、長)分組,即共形成12個小組,將每個小組中的患者隨機均分入治療組與對照組中去,這是使“性別、病情、病程”3個重要非試驗因素對觀測結果的影響在治療組與對照組之間達到平衡的重要舉措,也是所有臨床試驗研究成敗與否的最關鍵環節!
3 實驗設計類型判斷錯誤
例2:某作者欲觀察甘草酸、潑尼松對慢性馬兜鈴酸腎病(AAN)腎損害的干預作用,于是,進行了實驗,數據見表1。原作者經過用甘草酸和潑尼松分別與同期正常對照組和模型組比較,一個P<0.05,另一個P<0.01,于是得到甘草酸、潑尼松對慢性AAN腎損害具有一定程度的保護作用,且潑尼松的效果更佳。請問原作者的結論可信嗎?表1 各組大鼠血BUN及SCr變化比較(略)注:與正常對照組同期比較,*P<0.05,**P<0.01;與模型組同期比較,P<0.05,P<0.01
對差錯的辨析與釋疑:本例錯誤極為典型,通常科研工作者欲觀察某種藥物是否有效,習慣上會建立正常對照組、模型組(即該藥物擬治療的病態組)和在模型組基礎上的用藥組(如本例中甘草酸組和潑尼松組)。這樣的設計本身并沒有錯,但這僅僅是專業上的“實驗安排(可稱為多因素非平衡組合實驗[1])”,而并非是統計學中所說的某種標準實驗設計類型。寫在“組別”之下的4個組,并非是一個因素的4個水平,而是2個因素水平的部分組合。這2個因素分別是“是否建模(即正常與模型2個水平)”和“用藥種類[即不用藥(相當于安慰劑)、用甘草酸和用潑尼松3個水平]”。2個因素共有6種水平組合,即“組別”之下缺少了“正常基礎上用甘草酸”和“正常基礎上用潑尼松”。這樣設計的實驗才可能反映出“是否建模”與“用藥種類”2個因素之間是否存在交互作用。
在本課題研究中,由于未在實驗前作出正確的實驗設計,處理數據時錯誤就悄然產生了。具體到本例,從原作者在表1的注解中可以看出,通過單因素方差分析分別比較同期(即相同觀測時間點)的甘草酸組和潑尼松組與正常對照組和模型組之間的差別是否有統計學意義。這樣的做法有3個嚴重錯誤:第一,嚴格地說,在模型組基礎上的用藥組是不適合直接與正常對照組相比較的,因為這樣的比較解釋不清到底是藥物的作用還是由于模型未建成功而造成的假象;第二,將各個時間點割裂開分別比較破壞了原先的整體設計,數據利用率降低,誤差估計不準確,導致結論的可信度降低。將一個重復測量實驗的各個時間點割裂開來考察,就等于在各個片段上估計實驗誤差、作出統計推斷,好像盲人摸象一樣,摸出來的結果差別何其之大;第三,要想說明兩種藥物哪個效果更佳,在得出差別具有統計學意義的基礎上,衡量的標準是應看組間平均值的差量的大小而不應看P值是否足夠地小,不能說P<0.01時就比P<0.05時更有效,這種忽視實驗誤差、忽視絕對數量和脫離專業知識的想法和做法都是不妥當的。
如何正確處理表1中的實驗資料呢?關鍵要正確判定該定量資料所對應的是什么實驗設計類型。由前面的分析可知,表1定量資料對應的是“多因素非平衡組合實驗”,而不是某種標準的多因素實驗設計類型。明智的做法是對“組別”進行合理拆分,即根據專業知識和統計學知識,對“組別”之下的所有組重新進行組合,應使每種組合對應著一個標準的實驗設計類型。正確地拆分結果分別見表2和表3。表2 正常對照組與模型組大鼠血BUN及SCr變化的測定結果(略)表3 模型組和2個用藥組大鼠血BUN及SCr變化的測定結果(略)
事實上,由科研習慣形成的這一套實驗方案筆者形象地稱之為多因素非平衡的組合實驗,或者說,它是實驗設計的表現型。通常可以進行統計分析的都必須是標準型(即統計學上所說的某種實驗設計類型),因此需要能看出代表表現型本質的原型(本例中組別之下應該有6個組,這6個組構成一個2×3析因設計結構,但原作者少設計了2個組)。通常需要將表現型或/和原型拆分成標準型后再選擇合適的統計分析方法進行數據分析。本例根據原作者的意圖,可以將表1拆分成2個標準型,形成2個具有一個重復測量的兩因素設計定量資料,見表2和表3。相應的統計分析方法就是具有一個重復測量的兩因素設計定量資料的方差分析。此處請讀者注意:第一,具有一個重復測量的兩因素設計定量資料的方差分析和一般的方差分析雖然都叫方差分析,但它們的計算公式卻有本質區別,絕不可混用;第二,重復測量因素(本例中為時間)不要與實驗分組因素(表2中叫“是否建模”;表3中叫“藥物種類”)同時列入左邊,它們是本質不同的兩種因素,一般應該把“重復測量因素”放到表頭橫線下方。
通過本例可以看出,在實驗前明確實驗設計是多么重要的一件事情。試想,若讓本例原作者寫明他的實驗設計類型,他必然就會對基本的實驗設計類型作一番調查和學習,自然就能發現他所“設計”的實驗并不是統計學上相應的實驗設計。那么通過咨詢相關人士必能做出比較正確的實驗設計,不僅可以提高科研設計水平,而且可以大大提高科研課題和論文質量。
例3:原文題目為《土荊芥-水團花對胃潰瘍大鼠黏膜保護作用的研究》。原作者使用單因素多水平設計定量資料方差分析處理表4中的數據。請問原作者這樣做對嗎?表4 各組黏膜肌層寬度、再生黏膜厚度變化(略)注:與正常組比較,aP<0.05;與NS組比較,bP<0.05;與CP 10 mg·kg-1 組比較,cP<0.05
對差錯的辨析與釋疑:本例涉及到統計學三型理論[1]中的一些概念,簡單地說就是可以直接進行統計分析的來自標準設計的數據表叫標準型,反映問題本質但并非是標準型的數據表叫原型,而掩蓋了原型信息的數據表叫表現型。“組別”之下的6個組,似乎是某個因素的6個水平,其實不然!這6個組涉及到多個試驗因素,應對“組別”拆分重新組合后,再分別判定各種組合所對應的實驗設計類型,并選用相應的統計分析方法。組合1:空白對照組(正常)、陰性對照組(NS),這是單因素兩水平設計(簡稱為成組設計)。由于正常組無實驗數據,故該組合無法進行統計分析;組合2:NS組、RA組、CP(20/mg·kg-1)組,這是單因素3水平設計,因素的名稱叫“藥物種類”;組合3:NS組、CP(10/mg·kg-1)組、CP(15/mg·kg-1)組、CP(20/mg·kg-1)組,這是單因素4水平設計,因素名稱叫CP的劑量(其中,NS組可視為CP的劑量為0)。
對于組合2和組合3,若定量資料滿足參數檢驗的前提條件,可選用相應設計定量資料的方差分析,否則,需要改用相應設計定量資料的秩和檢驗。
4 人為改變設計類型且數據利用不全
例4:某作者使用表5中的數據進行分析,欲比較治療組和對照組在治療后的各個時間點的療效情況,使用的分析方法為一般卡方檢驗,請問原作者這樣做對嗎?
對差錯的辨析與釋疑:從給出的統計表可以看出,該作者有意或者無意之間收集了一類相當復雜的實驗設計類型下的定性資料,結果變量為多值有序變量的具有一個重復測量的兩因素設計定性資料,處理這個設計下收集的定性資料要使用相應設計定性資料的統計模型分析法。由于上述方法過于復雜,因此,通常在實際運用中,實際工作者將重復測量因素武斷地視為實驗分組因素,從而使該資料變為結果變量為多值有序變量的三維列聯表資料。在已經出錯的前提下,原本應當使用CMH校正的秩和檢驗或者有序變量的多重logistic回歸分析處理資料。然而,該作者顯然在此基礎上進一步合并了數據,將結果變量變成二值變量(有效、無效),也就是說,原作者實際使用的僅僅是最后一列數據(即總有效率),并且最為嚴重的錯誤是將三維列聯表資料強行降維成二維列聯表資料,使用一般χ2檢驗進行分析。經過一系列的簡化與錯誤合并,最后結論的可信度還剩下多少呢?表5 原作者對2組療效比較的試驗設計及數據表達(略)注:與對照組同期比較,*P<0.05
由于篇幅所限,這類錯誤筆者只給出1例,實際上此類例子在很多雜志中普遍存在。這說明在進行實驗設計時,很多研究人員并未做到心中有數;分析數據時,按自己熟悉的簡單統計分析方法所能解決的數據結構強硬地改造數據,嚴格地說,在用表格表達實驗資料的那一剎那就已人為改變了資料所對應的實驗設計類型,這種做法的科學性和得出結論的正確性都將受到質疑[2]。
5 正交設計及數據處理方面的錯誤
人們在進行正交設計和對正交設計定量資料進行統計分析時,常存在下列3個誤區:很多人過分強調用正交設計可以大大減少實驗次數,因此,無論各實驗條件(正交表中的每一行)下的實驗結果波動有多大,都不做重復實驗,這是第1個誤區;將正交表各列上都排滿試驗因素,用對實驗結果影響最小的試驗因素所對應的標準誤作為分析其他因素是否具有統計學意義的誤差項,導致誤差項的自由度較小,結論的可信度較低,這是第2個誤區;在對正交設計定量資料進行方差分析后,即使存在多個無統計學意義的因素,仍對少數幾個有統計學意義的因素進行解釋,未將無統計學意義的因素合并到誤差項中去重新估計實驗誤差,以獲得具有較大自由度的誤差項,這是第3個誤區。
參考文獻