Panda: Mengeluarkan Nombor daripada Rentetan
Apabila bekerja dengan bingkai data dalam Pandas, selalunya perlu untuk mengekstrak maklumat berangka daripada sel yang mengandungi bukan -aksara angka. Ini mungkin mencabar, tetapi Pandas menyediakan beberapa kaedah untuk membantu anda mencapai matlamat ini.
Menggunakan str.extract() untuk Pengekstrakan Nombor
Satu kaedah berkesan untuk mengekstrak nombor daripada rentetan ialah str.extract(). Kaedah ini membolehkan anda menentukan corak ungkapan biasa yang mentakrifkan data berangka yang anda mahu tangkap.
Pertimbangkan bingkai data berikut:
<code class="python">import pandas as pd import numpy as np df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'], }) print(df)</code>
Output:
A 0 1a 1 NaN 2 10a 3 100b 4 0b
Untuk mengekstrak nombor daripada setiap sel, anda boleh menggunakan ungkapan biasa berikut:
<code class="python">df.A.str.extract('(\d+)')</code>
Corak regex (d ) menangkap sebarang jujukan satu atau lebih digit. Tanda kurung di sekeliling corak mencipta kumpulan penangkapan, yang digunakan untuk mengembalikan bahagian rentetan yang dipadankan.
Output:
0 1 1 NaN 2 10 3 100 4 0 Name: A, dtype: object
Seperti yang anda lihat, nombor yang diingini telah berjaya diekstrak daripada setiap sel, walaupun yang mengandungi aksara bukan angka. Ambil perhatian bahawa kaedah ini hanya berfungsi untuk nombor bulat dan bukan untuk nombor titik terapung.
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Nombor daripada Rentetan Bukan Nombor dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!