Penapisan Subrentetan DataFrame Pandas
Menapis DataFrame panda berdasarkan padanan rentetan separa ialah tugas manipulasi data biasa. Untuk mencapai matlamat ini, kaedah rentetan vektor, yang diperkenalkan dalam panda versi 0.8.1, menawarkan penyelesaian yang elegan.
Berbeza dengan pendekatan tradisional menggunakan ungkapan biasa (cth., re.search() untuk menyemak sel individu, divektorkan kaedah rentetan membolehkan operasi yang cekap pada keseluruhan lajur Contohnya, untuk memilih baris di mana lajur 'A' mengandungi subrentetan 'hello', anda boleh menggunakan yang berikut. kod:
df[df['A'].str.contains("hello")]
Sintaks ini memanfaatkan atribut str bagi objek Siri, yang menyediakan julat fungsi manipulasi rentetan Kaedah contains() mengembalikan topeng boolean yang menunjukkan sama ada setiap elemen dalam lajur 'A' mengandungi subrentetan yang ditentukan. Topeng yang terhasil kemudiannya digunakan untuk menapis DataFrame, memilih hanya baris yang memenuhi kriteria.
Kaedah ini menawarkan cara yang ringkas dan cekap untuk melakukan padanan rentetan separa dalam DataFrames panda, memperkemas operasi penapisan data.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menapis Bingkai Data Pandas Berdasarkan Padanan Substring?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!