Menambah Berbilang DataFrames dalam For Loop dalam Python
Apabila bekerja dengan set data besar yang disimpan dalam berbilang fail Excel, selalunya perlu untuk menyatukan semua data ke dalam satu DataFrame untuk analisis atau pemprosesan selanjutnya. Ini boleh dicapai dengan mudah menggunakan perpustakaan panda Python dalam gelung for.
Untuk menambahkan bingkai data, adalah penting untuk ambil perhatian bahawa kaedah DataFrame.append() memerlukan sekurang-kurangnya dua argumen. Dalam kod yang disediakan, hanya satu hujah, data, diluluskan. Pendekatan yang betul ialah menyimpan semua DataFrames dalam senarai dalam gelung, dan kemudian gunakan pd.concat untuk menggabungkan senarai menjadi satu DataFrame.
Berikut ialah penjelasan terperinci:
<code class="python">import pandas as pd import glob # Initialize an empty list to store DataFrames appended_data = [] # Iterate over Excel files in a specified directory for infile in glob.glob("*.xlsx"): print("Processing file:", infile) # Read data from Excel file into a DataFrame data = pd.read_excel(infile) # Append DataFrame to the list appended_data.append(data) # Concatenate DataFrames to create a consolidated DataFrame final_df = pd.concat(appended_data, ignore_index=True) # Save consolidated data to a new Excel file final_df.to_excel('appended.xlsx', index=False)</code>
Dengan mengikuti pendekatan ini, anda boleh menambahkan berbilang DataFrames dengan lancar dalam gelung untuk dan menyimpan data yang disatukan ke fail Excel baharu. Ini membolehkan anda bekerja dengan set data yang besar dan terputus-putus dengan cekap dan berkesan.
Atas ialah kandungan terperinci Bagaimana untuk Menambahkan Berbilang DataFrames dengan Cekap dalam For Loop dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!