機械学習 (ML) における Python の人気は、その使いやすさ、柔軟性、および広範なライブラリ サポートに由来しています。このガイドでは、ML に Python を使用するための基礎的な概要を提供し、重要なライブラリをカバーし、簡単なモデルの構築を示します。
ML 分野における Python の優位性は、いくつかの重要な利点によるものです。
Python は、データ分析からモデルのデプロイメントまで、ML プロセスのあらゆる段階に対応する包括的なツールを提供します。
ML の取り組みを開始する前に、次の重要な Python ライブラリについてよく理解してください。
NumPy: Python の数値計算の基礎。 配列、行列、数学関数のサポートを提供します。
Pandas: データの操作と分析のための強力なライブラリです。 その DataFrame 構造により、構造化データの操作が簡素化されます。
Scikit-learn: Python で最も広く使用されている ML ライブラリ。 分類、回帰、クラスタリングのアルゴリズムを含む、データ マイニングと分析のための効率的なツールを提供します。
pip を使用して必要なライブラリをインストールします。
<code class="language-bash">pip install numpy pandas scikit-learn</code>
インストールしたら、コーディングを開始する準備が整います。
花びらの測定に基づいてアヤメの種を分類するアヤメ データセットを使用して、基本的な ML モデルを構築しましょう。
ステップ 1: ライブラリをインポートする
必要なライブラリをインポートします:
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
ステップ 2: データセットをロードする
Scikit-learn を使用して Iris データセットを読み込みます:
<code class="language-python"># Load the Iris dataset iris = load_iris() # Convert to a Pandas DataFrame data = pd.DataFrame(iris.data, columns=iris.feature_names) data['species'] = iris.target</code>
ステップ 3: データ探索
データを分析します:
<code class="language-python"># Display initial rows print(data.head()) # Check for missing values print(data.isnull().sum()) # Summary statistics print(data.describe())</code>
ステップ 4: データの準備
特徴 (X) とラベル (y) を分離し、データをトレーニング セットとテスト セットに分割します。
<code class="language-python"># Features (X) and labels (y) X = data.drop('species', axis=1) y = data['species'] # Train-test split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)</code>
ステップ 5: モデルのトレーニング
ランダムフォレスト分類器をトレーニングする:
<code class="language-bash">pip install numpy pandas scikit-learn</code>
ステップ 6: 予測と評価
予測を行い、モデルの精度を評価します:
<code class="language-python">import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score</code>
おめでとうございます!最初の ML モデルが作成されました。 学習をさらに進めるには:
以上が機械学習のための Python 入門の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。