核密度估計

維基百科,自由的百科全書

核密度估計(英語:Kernel density estimation縮寫KDE)是在概率論中用來估計未知的密度函數,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基於數據集密度函數聚類算法提出修訂的核密度估計方法。

100個常態分佈亂數的核密度估計

核密度估計在估計邊界區域的時候會出現邊界效應

在單變量核密度估計的基礎上,可以建立風險價值的預測模型。通過對核密度估計變異係數的加權處理,可以建立不同的風險價值的預測模型。

一些比較常用的核函數是: 均勻核函數 , 加入帶寬後:

三角核函數 , 加入帶寬後:

伽馬核函數

定義[編輯]

為從單變量分布中抽取的獨立同分布樣本,給定點有未知的概率密度,我們對估計函數的形狀感興趣,其核密度估計器是

其中是非負的核函數,帶寬為平滑參數。帶下標h的核被稱為縮放核,定義為。直覺上講,在數據允許的範圍內應當選擇儘可能小的帶寬;然而,偏差和方差之間總有所權衡。

常用的核函數有:均勻核(Uniform)、三角核(Triangular)、雙權核(Biweight)、三權核(Triweight)、Epanechnikov核、正態核(Normal)等。從均方誤差的角度來看,Epanechnikov核是最佳的[1],儘管對於前面列出的核來說,效率的損失很小[2]。由於其數學特性良好,正態核經常被使用,即,其中是標準正態密度函數。

參考文獻[編輯]

  • 唐林俊、楊虎、張洪陽:核密度估計在預測風險價值中的應用 The Application of The Kernel Density Estimates in Predicting VaR,《數學的實踐與認識》2005年10期
  1. ^ Epanechnikov, V.A. Non-parametric estimation of a multivariate probability density. Theory of Probability and Its Applications. 1969, 14: 153–158. doi:10.1137/1114019. 
  2. ^ Wand, M.P; Jones, M.C. Kernel Smoothing. London: Chapman & Hall/CRC. 1995. ISBN 978-0-412-55270-0.