Python での層化サンプリング手法
Python による層化サンプリング手法
サンプリングは、統計学で一般的に使用されるデータ収集方法であり、分析のためにデータ セットからサンプルの一部を選択し、データ セット全体の特性を推測することができます。ビッグデータの時代では、データの量が膨大になり、分析に完全なサンプルを使用することは時間がかかり、経済的にも現実的ではありません。したがって、適切なサンプリング方法を選択することで、データ分析の効率を向上させることができます。この記事では主にPythonでの層別サンプリング手法を紹介します。
層化サンプリングとは何ですか?
サンプリングでは、層化サンプリングが一般的に使用される手法です。単純なランダム抽出とは異なり、層化抽出ではデータが母集団内の複数の層に分割され、各層は同じ属性特性を持ちます。次に、異なる確率に従って各層からサンプルが取得されます。この方法は、母集団に特別な特徴がある場合、特にその特徴が明らかな場合に適しており、層化サンプリングはより効果的な統計的サンプリング方法です。
なぜ層化サンプリングが必要なのでしょうか?
層化サンプリングの利点は、サンプリング精度を向上させ、サンプリング誤差を低減できることにより、より優れたモデルと推論を構築できることです。実際のデータ分析のシナリオでは、母集団にはさまざまな種類の変数が存在し、これらの変数の処理が不適切であると逸脱やエラーが発生し、確立されたモデルが現実の状況に近づくことができなくなります。層化サンプリング技術を使用すると、収集されたサンプルを制御できるため、さまざまな変数で構成されるサンプルが母集団の実際の状況をより正確に反映できます。
Python で層化サンプリングを実行するにはどうすればよいですか?
Python には層化サンプリングを実装できるさまざまなパッケージがあり、その中で最も有名なのは numpy ライブラリと pandas ライブラリです。どちらのライブラリも、層化サンプリング手法の実装に役立つ多くの便利な関数を提供します。
以下では、例を使用して、Python を使用して層化サンプリングを実装する方法を示します。
この例では、性別、年齢、身長、体重、喫煙の有無を含む 5 つの変数を含む実験データセットがあると仮定します。このデータセットは、層別サンプリング手法に適しています。
まず、データセットをさまざまなレイヤーに分割する必要があります。層別変数として性別を選択し、男性と女性を 2 つの層に分けました。
import pandas as pd # 生成测试数据 data = pd.DataFrame({ 'sex': ['M', 'M', 'M', 'F', 'F', 'F'], 'age': [18, 20, 22, 25, 27, 30], 'height': [170, 172, 175, 160, 165, 170], 'weight': [65, 70, 75, 55, 60, 65], 'smoke': [1, 1, 0, 0, 1, 0] }) # 分层抽样 male = data[data['sex'] == 'M'] female = data[data['sex'] == 'F']
次に、各レベルのサンプル サイズと対応するサンプリング比率を決定する必要があります。この例では、サンプルの 10% が女性から採取され、20% が男性から採取されると仮定します。
# 分层抽样比例 sampling_prop = { 'M': 0.2, 'F': 0.1 } # 计算每个层级的样本大小 m_size = int(len(male) * sampling_prop['M']) f_size = int(len(female) * sampling_prop['F'])
最後に、numpy ライブラリのrandom.choice関数を使用して、各レベルからサンプルを抽出できます。この例では、各層から必要な層のサンプルを抽出します。
import numpy as np # 分层抽样 msample = male.sample(m_size) fsample = female.sample(f_size) # 整合分层样本 sample = pd.concat([msample, fsample])
層化サンプリングの結果は比較的正確になり、完全なサンプルで確立されたモデルはより簡単に広く使用されます。実際には、層化サンプリング手法を適用すると、データ調査の効率と精度が向上し、より正確な結論が得られます。
以上がPython での層化サンプリング手法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









Win11 のヒントの共有: Microsoft アカウントのログインをスキップする 1 つのトリック Windows 11 は、新しいデザイン スタイルと多くの実用的な機能を備えた、Microsoft によって発売された最新のオペレーティング システムです。ただし、一部のユーザーにとっては、システムを起動するたびに Microsoft アカウントにログインしなければならないのが少し煩わしい場合があります。あなたがそのような人であれば、次のヒントを試してみるとよいでしょう。これにより、Microsoft アカウントでのログインをスキップして、デスクトップ インターフェイスに直接入ることができるようになります。まず、Microsoft アカウントの代わりにログインするためのローカル アカウントをシステムに作成する必要があります。これを行う利点は、

C 言語では、他の変数のアドレスを格納するポインタを表し、& は変数のメモリ アドレスを返すアドレス演算子を表します。ポインタの使用に関するヒントには、ポインタの定義、ポインタの逆参照、ポインタが有効なアドレスを指していることの確認が含まれます。アドレス演算子の使用に関するヒントには、変数アドレスの取得、配列要素のアドレスを取得するときに配列の最初の要素のアドレスを返すことなどが含まれます。 。ポインター演算子とアドレス演算子を使用して文字列を反転する実際の例。

私たちは Excel で表を作成したり編集したりすることがよくありますが、ソフトウェアに触れたばかりの初心者にとって、Excel を使用して表を作成する方法は私たちほど簡単ではありません。以下では、初心者、つまり初心者がマスターする必要があるテーブル作成のいくつかの手順について演習を行います。初心者向けのサンプルフォームを以下に示します。入力方法を見てみましょう。 1. Excel ドキュメントを新規作成するには 2 つの方法があります。 [デスクトップ]-[新規作成]-[xls]ファイル上の何もない場所でマウスを右クリックします。 [スタート]-[すべてのプログラム]-[Microsoft Office]-[Microsoft Excel 20**] を実行することもできます。 2. 新しい ex ファイルをダブルクリックします。

VSCode (Visual Studio Code) は、Microsoft によって開発されたオープン ソース コード エディターであり、強力な機能と豊富なプラグイン サポートを備えており、開発者にとって推奨されるツールの 1 つです。この記事では、初心者が VSCode の使用スキルをすぐに習得できるようにするための入門ガイドを提供します。この記事では、VSCode のインストール方法、基本的な編集操作、ショートカット キー、プラグインのインストールなどを紹介し、具体的なコード例を読者に提供します。 1. まず VSCode をインストールします。

Oracle データベース クエリ スキル: 重複データを 1 つだけ取得するには、特定のコード サンプルが必要です 実際のデータベース クエリでは、重複データから 1 つのデータだけを取得する必要がある状況によく遭遇します。この記事では、Oracle データベースのテクニックを使用して重複データから 1 つのレコードのみを取得する方法を紹介し、具体的なコード例を示します。シナリオの説明 従業員情報を含む、employee という名前のテーブルがあるとします。従業員情報が重複している可能性があります。すべての重複を見つける必要があります

Win11 のトリックが明らかに: Microsoft アカウントのログインをバイパスする方法 最近、Microsoft は新しいオペレーティング システム Windows11 を発表し、広く注目を集めています。以前のバージョンと比較して、Windows 11 はインターフェイスのデザインや機能の改善の点で多くの新しい調整を加えましたが、いくつかの議論も引き起こしました. 最も目を引く点は、ユーザーが Microsoft アカウントでシステムにログインすることを強制することです。ユーザーによっては、ローカル アカウントでログインすることに慣れており、個人情報を Microsoft アカウントにバインドすることに抵抗がある場合があります。

タイトル: PHP プログラミングのヒント: 3 秒以内に Web ページにジャンプする方法 Web 開発では、一定時間内に別のページに自動的にジャンプする必要がある状況によく遭遇します。この記事では、PHP を使用して 3 秒以内にページにジャンプするプログラミング手法を実装する方法と、具体的なコード例を紹介します。まず、ページ ジャンプの基本原理は、HTTP 応答ヘッダーの Location フィールドを通じて実現されます。このフィールドを設定すると、ブラウザは指定されたページに自動的にジャンプできます。以下は、P の使用方法を示す簡単な例です。

フォームは、Web サイトまたはアプリケーションの作成に不可欠な部分です。 Laravel は人気のある PHP フレームワークとして、豊富で強力なフォーム クラスを提供し、フォーム処理をより簡単かつ効率的にします。この記事では、Laravel フォームクラスを使用して開発効率を向上させるためのヒントをいくつか紹介します。以下、具体的なコード例を挙げて詳しく説明します。フォームの作成 Laravel でフォームを作成するには、まずビューに対応する HTML フォームを記述する必要があります。フォームを操作するときは、Laravel を使用できます
