Menghapuskan Aksara Tidak Diingini daripada Rentetan dalam Lajur DataFrame
Apabila berurusan dengan set data yang mengandungi data rentetan, selalunya perlu untuk mengekstrak maklumat yang bermakna dari dalam rentetan. Walau bagaimanapun, aksara atau pemformatan yang tidak diingini boleh mengaburkan data yang dikehendaki. Dalam senario ini, matlamatnya adalah untuk mengalih keluar bahagian yang tidak diingini ini dengan cekap.
Andaikan kami mempunyai lajur DataFrame dengan data berikut:
time | result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
Objektif kami adalah untuk memangkas data untuk mengalih keluar Awalan ' ' atau '-' dan akhiran 'a' atau 'b'. Output yang dikehendaki ialah:
time | result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
Untuk mencapai ini, kami menggunakan fungsi lambda dalam kaedah peta. Coretan kod berikut menyelesaikan tugas:
data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
Fungsi lstrip mengalih keluar sebarang aksara ' ' atau '-' di hadapan, manakala fungsi rstrip mengalih keluar sebarang 'a', 'A', 'b', aksara 'B' atau 'c'. Outputnya ialah DataFrame dengan data dipangkas yang dikehendaki.
Atas ialah kandungan terperinci Bagaimana untuk mengalih keluar Watak yang Tidak Diingini daripada Lajur Rentetan dalam DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!