核回歸
外觀
核回歸(又稱局部加權線性回歸)是統計學中用於估計隨機變量的條件期望的非參數方法。目的是找到一對隨機變量X和Y之間的非線性關係。
在任何非參數回歸中 ,變量的條件期望 相對於變量可以寫成:
m為一個未知函數。
Nadaraya–Watson核回歸
[編輯]1964年, Nadaraya和Watson都提出了估算作為局部加權平均值,使用內核作為加權函數的方法。 [1] [2] [3] Nadaraya–Watson估計量為:
是一個帶寬為 的核。 分母是一個總和為1的加權項。
推導
[編輯]
將內核密度估計用於具有內核K的聯合分布f(x,y)和f(x) ,
, ,
我們得到
這便是Nadaraya–Watson估計量。
Priestley–Chao核估計函數
[編輯]
此處 為帶寬(或平滑參數)。
Gasser–Müller核估計函數
[編輯]
此處
示例
[編輯]此示例基於加拿大截面工資數據,該數據由1971年加拿大人口普查公用帶中的隨機樣本組成,這些樣本適用於受過普通教育的男性(13年級)。共有205個觀測值。
右圖顯示了使用二階高斯核以及漸近變化範圍的估計回歸函數
程序實例
[編輯]
以下R語言命令使用npreg()
函數提供最佳平滑效果並創建上面給出的圖形。 這些命令可以通過剪切和粘貼在命令提示符下輸入。
install.packages("np")
library(np) # non parametric library
data(cps71)
attach(cps71)
m <- npreg(logwage~age)
plot(m,plot.errors.method="asymptotic",
plot.errors.style="band",
ylim=c(11,15.2))
points(age,logwage,cex=.25)
相關資料
[編輯]大衛·薩爾斯堡 (David Salsburg)指出 ,用於內核回歸的算法是獨立開發的,並且已用於模糊系統 :「通過幾乎完全相同的計算機算法,模糊系統和基於內核密度的回歸似乎是完全獨立於彼此而開發的。 」 [4]
統計實現
[編輯]- MATLAB 這些頁面 (頁面存檔備份,存於網際網路檔案館)上提供了免費的MATLAB工具箱,其中包括內核回歸,內核密度估計,危險函數的內核估計以及許多其他工具的實現(此工具箱是本書的一部分[5] )。
- Stata npregress , kernreg2 (頁面存檔備份,存於網際網路檔案館)
- R : np package的函數
npreg
可以執行內核回歸。 [6] [7] - Python :所述
KernelReg
在混合數據類型類statsmodels.nonparametric
子包(包括其他內核密度相關的類),封裝kernel_regression (頁面存檔備份,存於網際網路檔案館)作為的延伸sklearn (低效存儲器明智的,有用的,只有對於小數據集) - GNU Octave數學程序包:
相關資料
[編輯]- 內核平滑
- 局部回歸
參考文獻
[編輯]- ^ Nadaraya, E. A. On Estimating Regression. Theory of Probability and Its Applications. 1964, 9 (1): 141–2. doi:10.1137/1109020.
- ^ Watson, G. S. Smooth regression analysis. Sankhyā: The Indian Journal of Statistics, Series A. 1964, 26 (4): 359–372. JSTOR 25049340.
- ^ Bierens, Herman J. https://books.google.com/books?id=M5QBuJVtbWQC&pg=PA212
|chapterurl=
缺少標題 (幫助). The Nadaraya–Watson kernel regression function estimator. New York: Cambridge University Press. 1994: 212–247. ISBN 0-521-41900-X. - ^ Salsburg, D. The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. W.H. Freeman. 2002: 290–91. ISBN 0-8050-7134-2.
- ^ Horová, I.; Koláček, J.; Zelinka, J. Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing. Singapore: World Scientific Publishing. 2012. ISBN 978-981-4405-48-5.
- ^ np: Nonparametric kernel smoothing methods for mixed data types. [2019-10-14]. (原始內容存檔於2020-08-17).
- ^ Kloke, John; McKean, Joseph W. Nonparametric Statistical Methods Using R. CRC Press. 2014: 98–106. ISBN 978-1-4398-7343-4.
延申閱讀
[編輯]- Henderson, Daniel J.; Parmeter, Christopher F. Applied Nonparametric Econometrics. Cambridge University Press. 2015 [2019-10-14]. ISBN 978-1-107-01025-3. (原始內容存檔於2020-08-06).
- Li, Qi; Racine, Jeffrey S. Nonparametric Econometrics: Theory and Practice. Princeton University Press. 2007. ISBN 0-691-12161-3.
- Pagan, A.; Ullah, A. Nonparametric Econometrics. Cambridge University Press. 1999 [2019-10-14]. ISBN 0-521-35564-8. (原始內容存檔於2016-06-24).
- Simonoff, Jeffrey S. Smoothing Methods in Statistics. Springer. 1996. ISBN 0-387-94716-7.
外部連結
[編輯]- 可縮放比例的內核回歸 (頁面存檔備份,存於網際網路檔案館) (使用Matlab軟件)。
- 使用電子表格 (使用Microsoft Excel ) 進行內核回歸的教程 。
- 在線內核回歸演示 (頁面存檔備份,存於網際網路檔案館) Requires。 NET 3.0或更高版本。
- 具有自動帶寬選擇功能的內核回歸 (頁面存檔備份,存於網際網路檔案館) (使用Python)