目次
1. 正規分布
2. ベルヌーイ分布
3. 二項分布
4. ポアソン分布
5 です。 指数分布
6 のパラメーター λ に対応します。ガンマ分布
7. ベータ分布
8. 一様分布
9. 対数正規分布
10. T 分布
11. ワイブル分布
ホームページ テクノロジー周辺機器 AI データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

Dec 15, 2023 am 08:21 AM
データ分析 データサイエンス 基本配布

前回の「データ サイエンティストが 95% の時間使用する 11 個の基本チャート 」に続き、今日はデータ サイエンティストが 95% の時間使用する 11 個の基本チャートを配布します。これらの分布をマスターすることで、データの性質をより深く理解し、データ分析や意思決定の際により正確な推論や予測を行うことができます。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

1. 正規分布

正規分布はガウス分布とも呼ばれ、連続タイプの確率分布です。平均(μ)を中心、標準偏差(σ)を幅とした対称な釣鐘型の曲線を持ちます。正規分布は、統計学、確率論、工学などの多くの分野で重要な応用価値があります。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

正規分布の確率密度関数は次のように表すことができます。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

確率密度関数は次のように表されます。指定された値 x 近くの単位間隔内の正規分布する確率変数の値の確率密度。このうちμは平均値、σは標準偏差を表します

正規分布は実務で広く使われています。たとえば、人間の身長と体重の分布は正規分布に近似します。さらに、テストの得点は多くの場合正規分布しており、高得点と低得点を獲得する人は少なく、中間の得点を獲得する人が多くなります。この分布モデルは多くの分野で重要な応用価値があります

2. ベルヌーイ分布

ベルヌーイ分布 (ベルヌーイ分布) は、2 つの可能な結果のみを含む単一のランダム化試験を記述するために使用される離散確率分布です。ベルヌーイ試行には、表か裏、成功か失敗、はいかいいえなどがあります。たとえば、コインを投げたり、製品が認定されているかどうか、誰かが特定の製品を購入するかどうかをテストするなどです。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ベルヌーイ分布の確率質量関数は次のとおりです。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ベルヌーイ分布では、p は成功を表します。確率の範囲は次のとおりです。 0から1。 p が 0.5 に等しい場合、ベルヌーイ分布は一様分布に近づきます。

実際のベルヌーイ分布の適用: たとえば、二項分布は、ベルヌーイ分布の n 回の独立した反復実験です。

3. 二項分布

二項分布 (Binomial Distribution) は、n 回の独立した反復実験における成功数の確率分布を記述するために使用される離散確率分布です。各トライアルには、成功 (1 として記録) または失敗 (0 として記録) の 2 つの結果しかありません。成功の確率は p 、失敗の確率は 1-p です。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

二項分布の確率質量関数は次のように表現できます。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

このうち、P(X= k) は成功数が k である確率を表し、データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション は組み合わせ数で、n 回の試行から選ばれた k 個の成功した組み合わせの数を示します。 p は成功の確率で、範囲は 0 から 1 です。 n は試行回数です。

二項分布は実際に広く使用されています。たとえば、医学研究では、二項分布を使用して、特定の治療を受けた患者の成功率を計算できます。エンジニアリング分野では、二​​項分布を使用して、生産プロセス中の製品の合格率を評価できます。これらは、実際のアプリケーションにおける二項分布の重要な例です。

4. ポアソン分布

ポアソン分布 (ポアソン分布) は、イベント数の固定確率分布を記述するために使用される離散確率分布です。時間内に起こること。ポアソン分布は、イベントが独立しており、一定の平均レートで発生する状況に適しています。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ポアソン分布の確率密度関数は次のとおりです:

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ここで、P(X=k)は一定期間内にイベントがk回発生する確率を表し、λはイベントの平均発生率、つまり単位時間当たりに発生するイベントの平均数を表します。 e は自然定数で、2.718 にほぼ等しくなります。 k は発生するイベントの数を表します

ポアソン分布は実際に広く使用されています。たとえば、コールセンターでは、1 分あたりの通話数はポアソン分布とみなすことができます。 1 分あたりの呼び出し数は

5 です。 指数分布

指数分布 (Exponential Distribution) は、一定期間内にイベントが発生する確率を記述するために使用される連続確率分布です。 。指数分布は、イベントが互いに独立しており、一定の平均レートで発生する状況に適しています。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

指数分布の確率密度関数は次のとおりです。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

指定された環境内で発生するイベントの確率密度時間xはf(x,λ)で表されます。 λはイベントの平均発生率、つまり単位時間当たりに発生するイベントの平均数を表す。 e は自然定数で、ほぼ 2.718

指数分布は現実に多くの用途があります。たとえば、放射性崩壊では、放射性原子核の崩壊時間は指数関数的に分布していると見なすことができます。これは、減衰時間の確率分布が指数関数に従うことを意味します。平均減衰時間は、指数関数 λ

6 のパラメーター λ に対応します。ガンマ分布

ガンマ分布は、特定の環境内でイベントが発生する確率を記述するために使用される連続確率分布です。時間 。これは、イベントが互いに独立しており、平均発生率が一定のままである状況に適しています。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ガンマ分布の確率密度関数は次のとおりです:

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ここで、f(x) は、特定の時間 x 内に発生するイベントの確率密度を表します。 α と β は、ガンマ分布の形状パラメータとレート パラメータです。 α はガンマ分布の形状を決定するために使用され、その値の範囲は 0 から正の無限大までです。 βはイベントの平均発生率、つまり単位時間当たりに発生するイベントの平均数を表し、値の範囲は0から正の無限大までとなります。 e は自然定数で、ほぼ 2.718

ガンマ分布の実際への応用: たとえば、放射性崩壊: 放射性崩壊では、放射性原子核が崩壊するまでの時間をガンマ分布とみなすことができ、平均減衰時間は β/α です。

7. ベータ分布

ベータ分布は、一連の値における成功回数の確率分布を記述するために使用される連続確率分布です。これには、成功確率の期待値 (平均) と標準偏差 (標準偏差) を表す 2 つのパラメーターがあります。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ベータ分布の確率密度関数は次のとおりです。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

このうち、x は数を表します。成功すると、α と β はそれぞれ分布の形状パラメータを表します

ベータ分布は多くの実際的な問題に応用できます。たとえば、遺伝子編集では、研究者はベータ分布を使用して、遺伝子編集技術が特定の標的部位の編集に成功する確率を予測することがあります。金融分野では、ベータ分布は資産価格の変動性を説明したり、投資ポートフォリオの期待収益を計算したりするために使用できます。

8. 一様分布

一様分布は確率です。分布。特定の間隔内で均等に分布する一連の値を表すために使用されます。一様分布には、離散一様分布と連続一様分布の 2 種類があります。

離散一様分布: 離散確率変数の場合、X は離散一様分布に従うと言います。連続一様分布: 連続確率変数 X の確率密度関数が f(x) = 1/(b-a) であるとき、

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション#一様分布の特徴は、与えられた範囲内で間隔に応じて、すべての値が出現する可能性は同じになります。たとえば、公平なコインを投げた場合、表と裏の確率は 1/2 であり、これは一様分布です。

9. 対数正規分布

対数正規分布 (対数正規分布) は連続確率分布であり、確率変数の対数が正規分布に従うという特徴があります。言い換えれば、確率変数 X の対数 ln(X) が正規分布に従う場合、確率変数 X は対数正規分布に従うことになります。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

対数正規分布の確率密度関数は次のように表現できます。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ここで、μ は対数正規分布です。は対数正規分布の平均、σ は対数正規分布の標準偏差です。

対数正規分布は、金融 (株価、利回りなど)、生物学 (成長率など)、経済学 (消費者支出など) など、多くの実際の応用において非常に重要です。 。

10. T 分布

T 分布は連続確率分布であり、主にサンプルが小さい状況における平均値の分布を記述するために使用されます。 t 分布は正規分布に似ていますが、自由度 (k) に応じて尾部が左右に伸びる可能性があります。 t 分布は、サンプル平均と母集団平均の間の有意差を評価するための仮説検定など、統計的推論で広く使用されています。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

t 分布の期待値と分散は次のとおりです。

E(t)=0

書き換える内容は、 : Var( t)=k/(k-1)

t 分布の自由度 (k) は、サンプル サイズ (n) と母集団標準偏差との関係を表します。 k > 30 の場合、t 分布は正規分布に近くなります。k が 1 に近い場合、t 分布はコーシー分布 (コーシー分布) になります。

実際のアプリケーションでは、サンプル サイズが大きい場合 ( n>30 )、正規分布は仮説検定に使用でき、z 統計量は信頼区間を確立するために使用できます。ただし、サンプル サイズが小さい場合 (n

11. ワイブル分布

ワイブル分布 (ワイブル分布) は連続確率分布です。

ワイブル分布の確率密度関数は次のとおりです。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション

ワイブル分布では、x は確率変数とみなされ、λ はスケールと呼ばれます。パラメータ (scale)、k は形状パラメータ (shape) です。ウェーバー分布に関する限り、k が 1 に等しい場合、指数分布になります。 λ が 1 に等しい場合、これは最小化されたワイブル分布です。

以上がデータ サイエンティストが 95% の時間使用する 11 の基本ディストリビューションの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

CSV ファイルを読み取り、pandas を使用してデータ分析を実行する CSV ファイルを読み取り、pandas を使用してデータ分析を実行する Jan 09, 2024 am 09:26 AM

Pandas は、さまざまな種類のデータ ファイルを簡単に読み取り、処理できる強力なデータ分析ツールです。その中でも、CSV ファイルは最も一般的でよく使用されるデータ ファイル形式の 1 つです。この記事では、Pandas を使用して CSV ファイルを読み取り、データ分析を実行する方法と、具体的なコード例を紹介します。 1. 必要なライブラリをインポートする まず、以下に示すように、Pandas ライブラリと必要になる可能性のあるその他の関連ライブラリをインポートする必要があります。 importpandasaspd 2. Pan を使用して CSV ファイルを読み取ります。

データ分析手法の紹介 データ分析手法の紹介 Jan 08, 2024 am 10:22 AM

一般的なデータ分析手法: 1. 比較分析手法; 2. 構造分析手法; 3. クロス分析手法; 4. 傾向分析手法; 5. 因果分析手法; 6. 関連分析手法; 7. クラスター分析手法; 8 , 主成分分析法; 9. 散布分析法; 10. マトリックス分析法。詳細な紹介: 1. 比較分析手法: 2 つ以上のデータを比較分析して、相違点やパターンを見つける手法; 2. 構造分析手法: 全体の各部分と全体を比較分析する手法; 3. クロス分析手法、など。

データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション データ サイエンティストが 95% の時間使用する 11 の基本ディストリビューション Dec 15, 2023 am 08:21 AM

前回の「データ サイエンティストが 95% の時間使用する 11 個の基本チャート」に続き、今日はデータ サイエンティストが 95% の時間使用する 11 個の基本ディストリビューションをお届けします。これらの分布をマスターすることで、データの性質をより深く理解し、データ分析や意思決定の際により正確な推論や予測を行うことができます。 1. 正規分布 正規分布はガウス分布としても知られ、連続確率分布です。平均 (μ) を中心、標準偏差 (σ) を幅とした対称な釣鐘型の曲線を持ちます。正規分布は、統計学、確率論、工学などの多くの分野で重要な応用価値があります。

Go言語を使用した機械学習とデータ分析 Go言語を使用した機械学習とデータ分析 Nov 30, 2023 am 08:44 AM

今日のインテリジェント社会では、機械学習とデータ分析は、人々が大量のデータをより深く理解し、活用できるようになる不可欠なツールです。こうした分野でもGo言語は注目を集めているプログラミング言語となっており、その高速性と効率性から多くのプログラマーに選ばれています。この記事では、機械学習やデータ分析に Go 言語を使用する方法を紹介します。 1. 機械学習のエコシステム Go 言語は、Python や R ほど豊富ではありません。しかし、より多くの人が Go 言語を使い始めるにつれて、一部の機械学習ライブラリとフレームワークが

11 データ分析と機械学習のための高度な視覚化 11 データ分析と機械学習のための高度な視覚化 Oct 25, 2023 am 08:13 AM

視覚化は、複雑なデータのパターンと関係を直感的でわかりやすい方法で伝えるための強力なツールです。これらはデータ分析において重要な役割を果たし、生データや従来の数値表現からは識別することが難しい洞察を提供します。視覚化は複雑なデータのパターンと関係を理解するために非常に重要です。データ内の情報を明らかにし、複雑なデータをより理解しやすく意味のあるものにするのに役立つ、最も重要で知っておくべき 11 のグラフを紹介します。 1. KSPlotKSPlot は分布の違いを評価するために使用されます。中心となるアイデアは、2 つの分布の累積分布関数 (CDF) 間の最大距離を測定することです。最大距離が小さいほど、同じ分布に属する可能性が高くなります。したがって、主に分布の差異を決定するための「システム」として解釈されます。

ECharts と PHP インターフェイスを使用してデータ分析と統計グラフの予測を実装する方法 ECharts と PHP インターフェイスを使用してデータ分析と統計グラフの予測を実装する方法 Dec 17, 2023 am 10:26 AM

ECharts と PHP インターフェイスを使用して統計グラフのデータ分析と予測を実装する方法。データ分析と予測はさまざまな分野で重要な役割を果たします。データの傾向とパターンを理解し、将来の意思決定の参考にすることができます。 ECharts は、PHP インターフェイスを使用してデータを動的にロードして処理できる、豊富で柔軟なグラフ コンポーネントを提供するオープン ソース データ視覚化ライブラリです。この記事では、EChartsとphpインターフェースに基づいた統計グラフデータの分析と予測の実装方法を紹介し、提供します

Python と機械学習のロマンチックな旅、初心者から専門家への一歩 Python と機械学習のロマンチックな旅、初心者から専門家への一歩 Feb 23, 2024 pm 08:34 PM

1. Python と機械学習の出会い Python は、習得が簡単で強力なプログラミング言語として、開発者に深く愛されています。人工知能の一分野である機械学習は、コンピューターにデータから学習して予測や決定を行う方法を学習させることを目的としています。 Python と機械学習の組み合わせは完全に一致しており、一連の強力なツールとライブラリをもたらし、機械学習の実装と適用を容易にします。 2. Python 機械学習ライブラリの探索 Python には、機能豊富な機械学習ライブラリが多数用意されており、その中で最も人気のあるものには次のものがあります。 NumPy: 効率的な数値計算関数を提供し、機械学習の基本ライブラリです。 SciPy: より高度な科学計算ツールを提供します。

Go 言語の需要がより高いのはどの業界ですか? Go 言語の需要がより高いのはどの業界ですか? Feb 21, 2024 pm 10:39 PM

テクノロジーが急速に発展する現代では、さまざまなプログラミング言語がますます幅広い用途で使用されるようになり、その中でもGo言語は、効率的で簡潔、学びやすく使いやすいプログラミング言語として、ますます多くの企業で支持されています。そして開発者たち。 Go 言語 (Golang とも呼ばれます) は、Google によって開発されたプログラミング言語であり、シンプルさ、効率性、同時プログラミングを重視しており、さまざまなアプリケーション シナリオに適しています。では、どの業界で Go 言語の需要が大きいのでしょうか?次に、いくつかの主要な業界を分析し、その業界の Go 言語に対するニーズを調査します。インターネット

See all articles