稀有事件Logistic迴歸是什麼?如何操作實現其結果

凡是搞計量經濟的,都關注這個號了

所有計量經濟圈方法論

叢的code程式

, 宏微觀資料庫和各種軟

件都放在社群裡.歡迎到計量經濟圈社群交流訪問

.

稀有事件Logistic迴歸是什麼?如何操作實現其結果

之前,咱們圈子引薦了很多學術神器,受到海內外學者歡迎和認可。

對分類問題的研究大部分是在樣本分佈均衡的情況下開展的。比如對二分類,一般研究的是正樣本和負樣本的數量相當(比如各佔50%)或者相差不是那麼大(比如一類樣本佔30%,另一類樣本佔70%)。但在實際應用時,經常會碰到樣本傾斜問題,對於二分類而言,就會是某類的樣本比例遠小於另一類的樣本比例。在學術界,一般稱樣本少的那類為正類,稱正類代表的隨機事件為稀有事件。稀有事件的例子並不少,比如發生戰爭的機率,染上某種不常見疾病的機率,磁碟出現故障的機率,網路傳輸資料丟失的機率等。

下面是一篇經典文章,從理論到實證系統講解了稀有事件中的Logistic迴歸。

稀有事件Logistic迴歸是什麼?如何操作實現其結果

稀有事件Logistic迴歸是什麼?如何操作實現其結果

稀有事件Logistic迴歸是什麼?如何操作實現其結果

做稀有事件的Logit迴歸,哈佛大學的Gary King等教授開發了一個程式包,有Gauss和Stata兩種型別。這是King教授對應的主頁,各位學者可以自行下載參看:https://gking。harvard。edu/relogit

也可以透過下方網盤下載Stata程式包:

https://pan.baidu.com/s/1ZmkfN21byO2Ky2YPm_N8cw

提取碼:

cfwj

1。 What is RELOGIT?

RELOGIT is a suite of programs forestimating and interpreting logit results when the sample is unbalanced (oneoutcome is rarer than the other) or has been selected by a rule correlated withthe dependent variable。 RELOGITestimates the same logit model as the -logit- command, but with an estimatorthat give lower mean square error in the presence of rare events data forcoefficients, probabilities, and other quantities of interest。 The program, designedfor use with the Stata statistics package, offers a convenient way to implementthe procedures suggested in

Gary King and Langche Zeng。 1999a。“Logistic Regression in Rare Events Data,” Department of Government,Harvard University, available from http://GKing。Harvard。Edu。

and

Gary King and Langche Zeng。 1999b。“Estimating Absolute, Relative, and Attributable Risks in Case-ControlStudies,” Department of Government, Harvard University, available from http://GKing。Harvard。Edu。

咱們圈子強烈推薦下面這26篇Stata相關文章,儘管Python已經在咱們社群漸漸普及開來,但Stata在資料分析領域還是有一些特別之處。

以下是25篇關於面板(動態或靜態)資料的文章,裡面附上了程式和相關文獻,基本上可以解決大部分面板運用中的問題。