Mencari Padanan Rentetan Separa dalam Pandas DataFrame
Menapis DataFrame panda berdasarkan kriteria rentetan separa selalunya menjadi keperluan apabila berurusan dengan data teks. Artikel ini menunjukkan cara untuk melaksanakan operasi ini menggunakan kaedah Series.str yang berkuasa.
Pertimbangkan DataFrame dengan lajur nilai rentetan. Untuk menapis baris berdasarkan padanan rentetan separa, gunakan sintaks berikut:
df[df['column_name'].str.contains("partial_string")]
Kaedah str.contains() mengambil corak ungkapan biasa dan mengembalikan DataFrame boolean yang menunjukkan sama ada setiap sel dalam lajur yang ditentukan memenuhi corak.
Sebagai contoh, untuk mencari semua baris dalam DataFrame di mana lajur nama mengandungi subrentetan "John", gunakan kod berikut:
df[df['name'].str.contains("John")]
Kaedah ini serasi dengan panda versi 0.8.1 dan lebih baru, menyediakan cara yang cekap untuk melaksanakan padanan rentetan separa dalam operasi DataFrame anda.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Cari Padanan Rentetan Separa dalam Bingkai Data Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!