Pandas データフレームでの列の選択
データ操作タスクを処理する場合、特定の列を選択することが必要になります。 Pandas には、列を選択するためのさまざまなオプションがあります。
オプション 1: 列名の使用
名前で列を選択するには、単に列名のリストを次のように渡します。
df1 = df[['a', 'b']]
オプション 2: 数値を使用するインデックス
列インデックスがわかっている場合は、関数 iloc を使用してそれらを選択します。 Python のインデックス作成はゼロベースであることに注意してください。
df1 = df.iloc[:, 0:2] # Select columns with indices 0 and 1
代替オプション: 辞書を使用したインデックス作成
列インデックスが変更される可能性がある場合は、次のアプローチを使用します。
column_dict = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)} df1 = df.iloc[:, list(column_dict.keys())]
非推奨アプローチ
次のアプローチは、エラーが発生する可能性があるため推奨されません:
df1 = df['a':'b'] # Slicing column names does not work df1 = df.ix[:, 'a':'b'] # Deprecated indexing method
元のデータの保持
列は、元のデータフレームへのビューまたは参照のみを作成します。選択した列の独立したコピーが必要な場合は、copy() メソッドを使用します。
df1 = df.iloc[:, 0:2].copy()
以上がPandas DataFrame で列を効率的に選択するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。