(Random Forest) は、決定木 (前述) に基づくアンサンブル学習アルゴリズムで、分類問題と回帰問題の両方を処理できます。
ランダム フォレストの基本的な考え方は、サンプルと特徴をランダムに選択して複数の決定木を生成し、多数決 (分類問題) または平均値の計算 (回帰問題) を行うことによって最終結果を取得することです。具体的には、ランダム フォレストのトレーニング プロセスは次のステップに分けることができます。
まず、元のデータ セットから一定数のサンプルをランダムに選択して、新しいトレーニング セットを形成します
# すべての特徴から特定の数の特徴をノードの候補特徴としてランダムに選択します
from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 划分训练集和测试集 train, test = train_test_split(data, test_size=0.3) # 提取训练集特征和标签 train_x = train.drop(columns=['label']) train_y = train['label'] # 构建随机森林模型 rf = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=0) # 拟合模型 rf.fit(train_x, train_y) # 提取测试集特征和标签 test_x = test.drop(columns=['label']) test_y = test['label'] # 预测并计算准确率 pred_y = rf.predict(test_x) accuracy = accuracy_score(test_y, pred_y) print("Accuracy:", accuracy)
以上がPython人工知能アルゴリズムのランダムフォレストプロセスとは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。