優秀論文剖析——如何在統計分析階段控制混雜偏倚

作者:歡暢    封面:吉江

今天檸檬精想透過 廣州市6-9歲兒童體脂率與不同肥胖指標的關係研究統計分析部分來跟大家分享一下如何在統計分析階段控制混雜偏倚,希望也能借此鼓勵正在努力準備本科畢業論文的小夥伴一起把手上的工作做好~

文章是檸檬精本科期間發表的第一篇論文,發表於中華流行病學雜誌2017年第11期。中華流行病學雜誌由中華醫學會主辦,是北大中文核心期刊之一,2018年複合影響因子2。565,綜合影響因子2。210。

文章簡介

研究目的是分析不同肥胖指標與兒童體脂率的關係以及兒童肥胖指標的診斷價值。雙能X線測定的體脂率BF%為金標準,待評價的體格指標包括腰圍、體質指數、腰臀圍比和腰圍身高比。利用多元線性迴歸分析體格指標與BF%的關聯,利用受試者工作特性(ROC)曲線評價指標對肥胖的診斷價值。最後的結論為BMI是預測體脂率和兒童肥胖診斷的最佳簡易指標。

在我們的研究中,待研究的因素(體脂率)以外的因素,主要包括性別和年齡,也是我們所測量的體格指標的影響因素。此時,由性別和年齡等影響產生的誤差(即研究結果與真實情況存在偏差,甚至相去甚遠)我們稱為系統誤差,即

偏倚

今天我想跟大家分享的就是如何在統計分析階段減少或避免偏倚以提高研究真實性,現在請大家一起看文章的統計分析部分吧~

統計分析

1。所有調查資料均用EpiData 3。1軟體指定統一的錄入介面,然後進行雙人雙份錄入。

EpiData是常用的調查資料錄入軟體,雙人雙份錄入,是用EpiData建立資料庫時,由兩人分別在不同計算機錄入,進行一致性檢驗,發現錯誤後核查原始調查表並修改,直至兩個資料庫達到一致,這也是減少偏倚的方法之一。

2。採用IBM SPSS 20。0 進行統計學分析,對於連續型變數採用均數、標準差描述,分類變數則採用頻數、百分率進行統計描述。

3。資料進行性別分層分析。

在分析階段控制混雜偏倚,主要是透過標準化、分層分析和多變數(多元)分析方法控制。此處則透過分層來控制由性別產生的混雜偏倚。

4。考慮到年齡是影響兒童體格指標的重要因素,因此為排除年齡的影響,各簡易體格指標利用殘差法進行年齡校正後,具體步驟如下:

1)以體格指標(y)作為因變數,年齡(x)作為自變數建立迴歸方程,得到y=β*x+常數項,同時儲存非標準化的殘差;

2)計算當x為均值時的y,即y =β*x +常數項;

3)將y與步驟1中儲存的非標準化殘差相加,即為校正後的值yi。

考慮到年齡對兒童體格指標的影響,透過殘差法來校正年齡對體格指標的影響,獲得的yi是排除了年齡影響後體格指標的校正值。

5。利用(yi-yi)/SD轉化為Z-score。

6。利用一般線性迴歸模型進行各指標Z-score與BF%相關分析,模型中年齡仍作為混雜因素以進一步校正其影響。

透過多元分析控制混雜偏倚,並分析相關性。男童體質指數的β為5。290%,可解釋為男童體質指數每增加一個單位,全身脂肪百分比變化5。290%。

優秀論文剖析——如何在統計分析階段控制混雜偏倚

7。以BF%診斷是否肥胖作為金標準,上述簡易指標為待測變數,採用MedCalc 11。4軟體進行ROC 曲線的繪製與分析,計算曲線下面積 (Area Under roc Curve,AUC);不同曲線下面積間的比較採用Tuan等推薦的方法。

優秀論文剖析——如何在統計分析階段控制混雜偏倚

ROC曲線分析在SPSS上即可實現分析,但MedCalc輸出的圖更加直觀、美觀,可選性比較強(此處為效果圖,非文章原圖)。

8。本研究檢驗水準定為雙側P

總結

雖然是一篇思路簡單的文章,但在統計分析時,我們往往不能簡單粗暴地做一個雙變數相關分析,而是透過分層、標準化、多元分析的分析方法去控制混雜因素引起的偏倚,力求獲得一個準確性更高的結果,一個更加可靠的結論。

參考文獻

[1]顏歡暢,郝宇婷,郭仰峰,等。 廣州市6~9歲兒童體脂率與不同肥胖指標關係的研究[J]。 中華流行病學雜誌,2017,38(11):1471-1475

[2] Willett WC, Howe GR, Kushi LH。 Adjustment for total energy intake in epidemiologic studies[M]。 1997。 1220S-1228S, 1229S-1231S。

[3] Tuan NT, Wang Y。 Adiposity assessments: agreement between dual-energy X-ray absorptiometry and anthropometric measures in US children [J]。 Obesity (Silver Spring), 2014, 22(6): 1495-1504。

作者:顏歡暢

院校專業:南方醫科大學流行病學與衛生統計學碩士

擅長:流行病學實驗設計與分析,生存分析,多元線性迴歸,ROC曲線分析等。

提==

學堂正在招募內容主筆、短影片創作者、課程講師,請在公眾號底部選單欄點選“招聘”瞭解詳情!