自舉法bootstrap是什麼意思?
自舉法bootstrap是非參數統計中一個重要的估計統計量變異數進而進行區間估計的統計方法。
bootstrap法是指用原樣本自身的數據抽樣得出新的樣本及統計量, 可以譯成「自舉」法吧,有的認為可譯為:自抽樣法。也就是透過既有樣本產生更多有用的信息的做法。
「直覺上就是:在已知資料的基礎上, 透過用電腦來模擬N趨近於無窮大時候的情況, 把已知的DATA不斷的重新SAMPLING, 從而在新的資料中得出原始資料的資訊。再說的更簡單更直觀就是: 就是給你100個數據, 但是你覺得100個數據沒辦法真實反映樣本的全貌, 你就把這100個數據重新隨機的SAMPLE1000次, 這樣你就有了100*1000個數據點了. 你的樣本量就會增大很多。」
Bootstrap的思想,是生成一系列bootstrap偽樣本,每個樣本是初始數據有放回抽樣。透過偽樣本的計算,獲得統計量的分佈。例如,要進行1000次bootstrap,求平均值的置信區間 ,可以對每個偽樣本計算平均值。這樣就獲得了1000個平均值。對著1000個平均值的分位數進行計算, 即可獲得信賴區間。已經證明,在初始樣本足夠大的情況下,bootstrap抽樣能夠無偏得接近總體的分佈。
以上是自舉法bootstrap是什麼意思的詳細內容。更多資訊請關注PHP中文網其他相關文章!