Cara Memisahkan Bingkai Data Panda Besar kepada Berbilang Kumpulan dengan np.array_split
Apabila berurusan dengan bingkai data yang besar, mungkin perlu untuk berpecah mereka menjadi bahagian yang lebih kecil dan lebih mudah diurus. Ini membolehkan pemprosesan dan analisis yang lebih cekap. Satu kaedah untuk memisahkan bingkai data ialah menggunakan fungsi np.split(). Walau bagaimanapun, fungsi ini boleh menghadapi masalah apabila bingkai data tidak boleh dibahagikan sama rata dengan bilangan pecahan yang diingini.
Alternatif yang lebih sesuai untuk situasi ini ialah menggunakan fungsi np.array_split(). Fungsi ini membenarkan parameter indeks_or_sections menjadi integer yang tidak membahagikan paksi sama rata.
<code class="python">import pandas as pd import numpy as np # Create a large dataframe df = pd.DataFrame(...) # Define the number of groups to split the dataframe into n_groups = 4 # Split the dataframe using np.array_split() dataframe_chunks = np.array_split(df, n_groups) # Iterate over the dataframe chunks and print their contents for item in dataframe_chunks: print(item)</code>
Nota Tambahan:
Atas ialah kandungan terperinci Bagaimana untuk Memisahkan DataFrame Panda Besar kepada Berbilang Kumpulan dengan Pembahagian Tidak Sekata Menggunakan np.array_split?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!