Pandas: カテゴリを数値インデックスに変換する
Pandas では、国、数値インデックスに変換します。 pd.get_dummies はカテゴリをワンホット エンコーディングに変換できますが、それが常に最も効率的なソリューションであるとは限りません。ここでは、カテゴリを数値インデックスに変換する方法についてのステップバイステップ ガイドを示します:
ステップ 1: 列を分類する
まず、列のタイプを次のように変更します。 categorical:
<code class="python">df.cc = pd.Categorical(df.cc)</code>
これにより、国の列が pd.Categorical(column_name) で示されるカテゴリ列に変換されます。
ステップ 2: コードの新しい列を作成する
次に、数値インデックスを保存する新しい列を作成します。
<code class="python">df['code'] = df.cc.codes</code>
カテゴリ列の code 属性は、各カテゴリに一意の整数インデックスを割り当てます。
例:
次の DataFrame について考えます:
cc temp 0 US 37.0 1 CA 12.0 2 US 35.0 3 AU 20.0
上記の手順に従うと、新しい DataFrame が作成されます:
cc temp code 0 US 37.0 2 1 CA 12.0 1 2 US 35.0 2 3 AU 20.0 0
追加オプション:
以上がPandas でカテゴリデータを数値インデックスに変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。