ホームページ > バックエンド開発 > Python チュートリアル > Pandas でカテゴリデータを数値インデックスに変換するにはどうすればよいですか?

Pandas でカテゴリデータを数値インデックスに変換するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-10-28 11:00:30
オリジナル
863 人が閲覧しました

How to Convert Categorical Data to Numerical Indices in Pandas?

Pandas: カテゴリを数値インデックスに変換する

Pandas では、国、数値インデックスに変換します。 pd.get_dummies はカテゴリをワンホット エンコーディングに変換できますが、それが常に最も効率的なソリューションであるとは限りません。ここでは、カテゴリを数値インデックスに変換する方法についてのステップバイステップ ガイドを示します:

ステップ 1: 列を分類する

まず、列のタイプを次のように変更します。 categorical:

<code class="python">df.cc = pd.Categorical(df.cc)</code>
ログイン後にコピー

これにより、国の列が pd.Categorical(column_name) で示されるカテゴリ列に変換されます。

ステップ 2: コードの新しい列を作成する

次に、数値インデックスを保存する新しい列を作成します。

<code class="python">df['code'] = df.cc.codes</code>
ログイン後にコピー

カテゴリ列の code 属性は、各カテゴリに一意の整数インデックスを割り当てます。

例:

次の DataFrame について考えます:

   cc  temp
0  US  37.0
1  CA  12.0
2  US  35.0
3  AU  20.0
ログイン後にコピー

上記の手順に従うと、新しい DataFrame が作成されます:

   cc  temp  code
0  US  37.0     2
1  CA  12.0     1
2  US  35.0     2
3  AU  20.0     0
ログイン後にコピー

追加オプション:

  • データフレームを変更せずにコードを取得: df.cc.astype('category').codes
  • カテゴリ列をインデックスとして作成します: df2 = pd.DataFrame(df.temp); df2.index = pd.CategoricalIndex(df.cc)

以上がPandas でカテゴリデータを数値インデックスに変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート