このタスクの目標は、複数の CSV ファイルをディレクトリから単一の pandas DataFrame にインポートすることです。これを実現する方法は次のとおりです:
まず、ファイル処理とデータ操作に必要なライブラリをインポートします:
import pandas as pd import glob import os
CSV ファイルを読み取って連結するには、次の手順に従います。手順:
これらを組み合わせたサンプルコードは次のとおりです手順:
# Get file names path = r"C:\DRO\DCL_rawdata_files" filenames = glob.glob(os.path.join(path, "*.csv")) dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename, header=0)) # Concatenate data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True)
異なる CSV ファイルのデータを区別するには、各ファイルを識別するための新しい列を追加します。そのためのいくつかのオプションを次に示します。
オプション 1: ファイル名を列として追加します
for df in dfs: df["file_name"] = df.file_name.str.split("\").str[-1].str.split(".")[0]
オプション 2: ファイル ソースを列として追加しますコラム
df["Source"] = np.repeat([f"File{i}" for i in range(len(dfs))], [len(df) for df in dfs])
これらの手順に従うことで、複数の CSV ファイルを Python の単一のまとまった DataFrame に効率的にインポートでき、さまざまなデータの分析と処理が容易になります。ソース。
以上がPython で複数の CSV ファイルを単一の Pandas DataFrame に結合するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。