データ分析に不可欠なツールである Pandas で列名を変更するコツをマスターしましょう

PHPz
リリース: 2024-01-13 13:20:06
オリジナル
733 人が閲覧しました

データ分析に不可欠なツールである Pandas で列名を変更するコツをマスターしましょう

データ分析ツール: Pandas で列名を変更するスキルをマスターする

はじめに:

データ分析のプロセスでは、よく遭遇します。データセットの列名を変更する必要があります。 Pandas は、Python で一般的に使用されるデータ処理ライブラリであり、データを処理および分析するための柔軟で強力な機能を提供します。今日は、Pandas で列名を変更する手法に焦点を当て、具体的なコード例を使用して説明します。

1. 既存の列名を確認する

まず、現在のデータ セットの列名を知る必要があります。 Pandas では、df.columns を使用して DataFrame の列名を表示します。たとえば、次のデータ フレーム df があります:

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}
df = pd.DataFrame(data)
ログイン後にコピー

df.columns を使用して df の列名を表示できます:

print(df.columns)
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

実行結果は次のとおりです。

Index(['A', 'B', 'C'], dtype='object')
ログイン後にコピー

2. 列名を変更する

  1. 列名を直接変更する

Pandas では、代入を通じて列名を直接変更できます。たとえば、列名 'A' を 'New_A' に変更したいとします:

df.columns = ['New_A', 'B', 'C']
ログイン後にコピー

実行後、df の列名を再度確認します:

print(df.columns)
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

実行結果は次のとおりです。

Index(['New_A', 'B', 'C'], dtype='object')
ログイン後にコピー

このようにして、変更する必要があるすべての列名を一度に変更できます。

  1. rename() 関数を使用して列名を変更する

値を直接割り当てて列名を変更することに加えて、Pandas は、列名を変更するための rename() 関数も提供します。列名を変更します。この方法はより柔軟であり、一部の列名を選択的に変更できます。たとえば、列名 'B' を 'New_B' に変更する場合、次のコードを使用できます:

df = df.rename(columns={'B': 'New_B'})
ログイン後にコピー

実行後、df の列名を再度確認します:

print(df.columns)
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

The実行結果は次のとおりです。

Index(['New_A', 'New_B', 'C'], dtype='object')
ログイン後にコピー

この方法では、他の列名の名前には影響せずに、指定された列名のみを変更します。

  1. map() 関数を使用して列名の一部を変更する

場合によっては、前にプレフィックスを追加するなど、列名の部分的な変更が必要になる場合があります。列名の。部分的な列名を操作するには、map() 関数を使用します。たとえば、列名の前にプレフィックス「New_」を追加すると、次のコードを使用できます:

df.columns = df.columns.map(lambda x: 'New_' + x)
ログイン後にコピー

実行後、df の列名を再度確認します:

print(df.columns)
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

実行結果は次のとおりです。

Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')
ログイン後にコピー

このようにして、列名を部分的に柔軟に変更できます。

3. アプリケーション シナリオ

Pandas で列名を変更するスキルを習得することは、データ分析タスクにとって非常に重要です。以下に、いくつかのアプリケーション シナリオの例を示します。

  1. データ クリーニング: データ クリーニングのプロセスでは、多くの場合、列名を標準化し、非標準の列名を統一された命名規則に変更する必要があります。
  2. データのマージ: merge() または join() 関数を使用してデータをマージする場合、異なるデータ ソースの列を区別するためにマージされた列名を変更することが必要になることがよくあります。
  3. データ エクスポート: データを Excel または CSV ファイルにエクスポートする場合、列名を変更してよりわかりやすいものにし、ファイルの読みやすさを向上させることができます。

概要:

この記事の導入部を通じて、Pandas で列名を変更する手法について学び、具体的なコード例を使用してそれを示しました。これらのスキルを習得すると、データ分析プロセス中に列名をより柔軟に変更し、データの処理と分析の効率を向上させることができます。同時に、合理的な列の名前付けは、データの読みやすさと理解しやすさの向上にも役立ち、データ分析結果の解釈と視覚的な表示に非常に役立ちます。この記事があなたのデータ分析作業に役立つことを願っています。読んでいただきありがとうございます。

以上がデータ分析に不可欠なツールである Pandas で列名を変更するコツをマスターしましょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート