Bootstrap方法是非常有用的一種統計上的估計方法,是斯坦福統計系的教授Bradley Efron在總結、歸納前人研究成果的基礎上提出一種新的非參數統計方法。
Bootstrap是一類非參數Monte Carlo方法,其實質是對觀測資訊進行再抽樣,進而對總體的分佈特性進行統計推論。
因為該方法充分利用了給定的觀測訊息,不需要模型其他的假設和增加新的觀測,並且具有穩健性和效率高的特徵。自1980年代以來,隨著電腦技術被引入統計實踐中來,此方法越來越受歡迎,在機器學習領域應用也很廣泛。
首先,Bootstrap透過重抽樣,可以避免了Cross-Validation造成的樣本減少問題,其次,Bootstrap也可以用來創造資料的隨機性。例如,我們所熟知的隨機森林演算法第一步就是從原始訓練資料集中,應用bootstrap方法有放回地隨機抽取k個新的自助樣本集,並由此建構k棵分類回歸樹。
以上是bootstrap方法是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!