Memisahkan Bingkai Data Panda Besar
Pertimbangkan DataFrame panda besar yang terdiri daripada 423244 baris. Timbul keperluan untuk membahagikan DataFrame ini kepada empat bahagian yang sama. Walau bagaimanapun, percubaan menggunakan np.split(df, 4) melemparkan ralat "ValueError: pemisahan tatasusunan tidak menghasilkan pembahagian yang sama".
Untuk menangani isu ini, np.array_split harus digunakan. Tidak seperti np.split, np.array_split membenarkan indeks_atau_bahagian menjadi integer yang tidak menghasilkan pembahagian paksi yang sama.
<code class="python">import pandas as pd import numpy as np # Create a DataFrame df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.random.randn(8), 'D': np.random.randn(8)}) # Split the DataFrame into three equal parts result = np.array_split(df, 3) # Print the results for i in range(len(result)): print(f"Part {i + 1}:") print(result[i]) print()</code>
Kod ini akan membahagikan DataFrame kepada tiga bahagian yang lebih kurang sama. Bilangan bahagian boleh dilaraskan mengikut keperluan.
Atas ialah kandungan terperinci Bagaimana untuk Memisahkan DataFrame Panda Besar kepada Bahagian yang Sama?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!