ブートストラップ アルゴリズムとは何を意味しますか?

(*-*)浩
リリース: 2019-07-18 14:10:35
オリジナル
4098 人が閲覧しました

ブートストラップは、統計のばらつきを推定し、統計の間隔を推定できるノンパラメトリック統計における重要な統計手法であり、ブートストラップ法とも呼ばれます。

ブートストラップ アルゴリズムとは何を意味しますか?

核となるアイデアと基本的な手順は次のとおりです: (推奨される学習: Bootstrap ビデオ チュートリアル )

(1) 反復サンプリング技術を使用して、元のサンプルから一定数のサンプル(自分で与えることができ、通常は元のサンプルと同じ)を抽出することで、反復サンプリングが可能になります。

(2) 抽出したサンプルに基づいて推定する統計量 T を計算します。

(3) 上記を N 回 (通常は 1000 回以上) 繰り返して、N 個の統計値 T を取得します。

(4) 上記 N 個の統計量 T の標本分散を計算し、統計量 T の分散を推定します。

ブートストラップは現代の統計で人気のある統計手法であり、小さなサンプルでうまく機能するということを言っておきます。信頼区間は分散の推定によって構築でき、その適用範囲はさらに拡張されます。

具体的なサンプリング方法の例: 池の中の魚の数を知りたい場合は、まず N 匹の魚を抽出し、それらにマークを付けて、池に戻すことができます。

繰り返しサンプリングを行い、M 回抽出し、毎回 N 匹抽出し、毎回抽出された魚のうち、マークされた魚の割合を調べ、M 回の割合に基づいて統計を計算します。

データに明らかな層がある場合、層化サンプリングを使用して分析効率を向上できます。spss はデフォルトでノンパラメトリック ブートストラップ法を使用し、完全にランダムなサンプリングを使用します。したがって、層化サンプリングが必要な場合は、層化サンプリングを使用できません。デフォルトに依存するため、自分で設定する必要があります。

最も科学的で合理的であるために必要な観察の数にも特別な注意を払う必要があります。答えは 1,000 です。信頼区間はパーセンタイル法に従って計算されるため、この数値より小さい場合、計算結果が不正確になるため、小さすぎることはできません。 1000 を超える場合、ほとんどの場合、精度の向上は非常に限られており、システム リソースと計算時間が無駄になります。

ブートストラップのspss解析の操作手順:「解析」~「平均値の比較」~「平均値」~独立変数と従属変数の選択~「オプション」サブダイアログ~「セル統計」~ブートストラップサブダイアログボックス ~ ブートストラップを実行するチェックボックス

もう 1 点、従属変数が正規分布に一致するか、正規分布にほぼ一致する場合には、ブートストラップ法を使用する必要はありません。

Bootstrap に関連する技術的な記事については、Bootstrap チュートリアル 列にアクセスして学習してください。

以上がブートストラップ アルゴリズムとは何を意味しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート