Cara Memproses DataFrame Besar dengan Cekap dalam Panda: Potong!

Susan Sarandon
Lepaskan: 2024-10-27 07:57:03
asal
497 orang telah melayarinya

How to Efficiently Process Large DataFrames in Pandas: Chunk It Up!

Panda - Menghiris Bingkai Data Besar kepada Potongan

Apabila cuba memproses bingkai data bersaiz besar, halangan yang biasa ialah Ralat Memori yang digeruni. Satu penyelesaian yang berkesan ialah membahagikan kerangka data kepada bahagian yang lebih kecil dan boleh diurus. Strategi ini bukan sahaja mengurangkan penggunaan memori tetapi juga memudahkan pemprosesan yang cekap.

Untuk mencapainya, kita boleh memanfaatkan sama ada kefahaman senarai atau fungsi pembahagian_tatasusunan NumPy.

Pemahaman Senarai

<code class="python">n = 200000  # Chunk row size
list_df = [df[i:i+n] for i in range(0, df.shape[0], n)]</code>
Salin selepas log masuk
Menghiris mengikut AcctName
<code class="python">list_df = np.array_split(df, math.ceil(len(df) / n))</code>
Salin selepas log masuk
Untuk memisahkan bingkai data mengikut nilai AcctName, gunakan kaedah kumpulan mengikut:

Atas ialah kandungan terperinci Cara Memproses DataFrame Besar dengan Cekap dalam Panda: Potong!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!