データ分析ツール: Pandas で列名を変更するスキルをマスターする
はじめに:
データ分析のプロセスでは、よく遭遇します。データセットの列名を変更する必要があります。 Pandas は、Python で一般的に使用されるデータ処理ライブラリであり、データを処理および分析するための柔軟で強力な機能を提供します。今日は、Pandas で列名を変更する手法に焦点を当て、具体的なコード例を使用して説明します。
1. 既存の列名を確認する
まず、現在のデータ セットの列名を知る必要があります。 Pandas では、df.columns
を使用して DataFrame の列名を表示します。たとえば、次のデータ フレーム df があります:
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data)
df.columns
を使用して df の列名を表示できます:
print(df.columns)
実行結果は次のとおりです。
Index(['A', 'B', 'C'], dtype='object')
2. 列名を変更する
Pandas では、代入を通じて列名を直接変更できます。たとえば、列名 'A' を 'New_A' に変更したいとします:
df.columns = ['New_A', 'B', 'C']
実行後、df の列名を再度確認します:
print(df.columns)
実行結果は次のとおりです。
Index(['New_A', 'B', 'C'], dtype='object')
このようにして、変更する必要があるすべての列名を一度に変更できます。
値を直接割り当てて列名を変更することに加えて、Pandas は、列名を変更するための rename() 関数も提供します。列名を変更します。この方法はより柔軟であり、一部の列名を選択的に変更できます。たとえば、列名 'B' を 'New_B' に変更する場合、次のコードを使用できます:
df = df.rename(columns={'B': 'New_B'})
実行後、df の列名を再度確認します:
print(df.columns)
The実行結果は次のとおりです。
Index(['New_A', 'New_B', 'C'], dtype='object')
この方法では、他の列名の名前には影響せずに、指定された列名のみを変更します。
場合によっては、前にプレフィックスを追加するなど、列名の部分的な変更が必要になる場合があります。列名の。部分的な列名を操作するには、map() 関数を使用します。たとえば、列名の前にプレフィックス「New_」を追加すると、次のコードを使用できます:
df.columns = df.columns.map(lambda x: 'New_' + x)
実行後、df の列名を再度確認します:
print(df.columns)
実行結果は次のとおりです。
Index(['New_New_A', 'New_New_B', 'New_C'], dtype='object')
このようにして、列名を部分的に柔軟に変更できます。
3. アプリケーション シナリオ
Pandas で列名を変更するスキルを習得することは、データ分析タスクにとって非常に重要です。以下に、いくつかのアプリケーション シナリオの例を示します。
概要:
この記事の導入部を通じて、Pandas で列名を変更する手法について学び、具体的なコード例を使用してそれを示しました。これらのスキルを習得すると、データ分析プロセス中に列名をより柔軟に変更し、データの処理と分析の効率を向上させることができます。同時に、合理的な列の名前付けは、データの読みやすさと理解しやすさの向上にも役立ち、データ分析結果の解釈と視覚的な表示に非常に役立ちます。この記事があなたのデータ分析作業に役立つことを願っています。読んでいただきありがとうございます。
以上がデータ分析に不可欠なツールである Pandas で列名を変更するコツをマスターしましょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。