이 작업의 목표는 디렉터리에서 여러 CSV 파일을 단일 Pandas DataFrame으로 가져오는 것입니다. 이를 수행하는 방법은 다음과 같습니다.
먼저 파일 처리 및 데이터 조작에 필요한 라이브러리를 가져옵니다.
import pandas as pd import glob import os
CSV 파일을 읽고 연결하려면 다음을 따르세요. 단계:
다음은 이를 결합한 예제 코드입니다. 단계:
# Get file names path = r"C:\DRO\DCL_rawdata_files" filenames = glob.glob(os.path.join(path, "*.csv")) dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename, header=0)) # Concatenate data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True)
다른 CSV 파일의 데이터를 구분하려면 새 열을 추가하여 각 파일을 식별할 수 있습니다. 이를 위한 몇 가지 옵션은 다음과 같습니다.
옵션 1: 파일 이름을 열로 추가
for df in dfs: df["file_name"] = df.file_name.str.split("\").str[-1].str.split(".")[0]
옵션 2: 파일 소스를 열로 추가 칼럼
df["Source"] = np.repeat([f"File{i}" for i in range(len(dfs))], [len(df) for df in dfs])
이 단계를 따르면 여러 CSV 파일을 Python의 응집력 있는 단일 DataFrame으로 효율적으로 가져올 수 있으므로 다양한 데이터를 쉽게 분석하고 처리할 수 있습니다. 출처.
위 내용은 Python에서 여러 CSV 파일을 단일 Pandas DataFrame으로 결합하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!