Bagaimana untuk Mengekstrak Nilai Berangka daripada Lajur Rentetan dalam Panda?

Linda Hamilton
Lepaskan: 2024-10-24 13:28:31
asal
1051 orang telah melayarinya

How to Extract Numeric Values from String Columns in Pandas?

Manipulasi Data Pandas: Mengekstrak Nombor daripada Lajur Rentetan

Apabila bekerja dengan bingkai data dalam Pandas, ia menjadi perlu untuk melakukan pelbagai manipulasi untuk mengekstrak maklumat yang bermakna. Satu tugas sedemikian mungkin melibatkan mengekstrak nilai berangka daripada rentetan yang terkandung dalam lajur bingkai data. Di sini, kami meneroka senario khusus untuk menangani keperluan ini.

Pertimbangkan bingkai data berikut dengan lajur bernama 'A' yang mengandungi nilai rentetan:

<code class="python">import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
                   })
print(df)</code>
Salin selepas log masuk

Objektifnya adalah untuk ekstrak hanya nombor daripada setiap sel dalam lajur 'A', menghasilkan bingkai data baharu dengan lajur 'A' hanya mengandungi nilai angka.

Untuk mencapainya, seseorang boleh memanfaatkan str yang berkuasa .fungsi ekstrak dalam Panda. Dengan menggunakan kumpulan tangkapan regex dalam ungkapan str.extract, ia menjadi mungkin untuk mengasingkan dan mengekstrak digit daripada setiap rentetan dalam bingkai data:

<code class="python">df.A.str.extract('(\d+)')</code>
Salin selepas log masuk

Corak regex '(d )' sepadan dengan satu atau lebih banyak digit (d) dan menangkapnya sebagai satu kumpulan (tanda kurungan ( dan )). Menjalankan kod di atas menghasilkan hasil berikut:

<code class="python">    A
0   1
1   NaN
2   10
3   100
4   0
Name: A, dtype: object</code>
Salin selepas log masuk

Rentetan asal dalam lajur 'A' berjaya ditukar kepada nilai angka, manakala NaN dikekalkan untuk sel yang tiada nilai. Kaedah ini terbukti amat berkesan untuk mengekstrak nombor bulat daripada rentetan, menjadikannya alat yang berharga dalam analisis data dan senario manipulasi.

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Nilai Berangka daripada Lajur Rentetan dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan