Mengubah Suai Nilai Berdasarkan Kriteria Khusus dalam Panda
Apabila mengulangi Pandas DataFrame, selalunya perlu mengubah suai nilai tertentu berdasarkan kriteria yang sepadan . Untuk mencapai matlamat ini dalam Pandas, kami boleh memanfaatkan keupayaan pengindeksan dan penapisannya.
Memahami Masalah
Matlamatnya adalah untuk mengulangi lajur "ID" dalam DataFrame dan tukar lajur "FirstName" dan "LastName" dengan sewajarnya jika ID tertentu ditemui. Dalam Stata, ini boleh dicapai menggunakan:
replace FirstName = "Matt" if ID==103 replace LastName = "Jones" if ID==103
Pelaksanaan Panda
Untuk melaksanakan logik ini dalam Panda, kita boleh menggunakan pendekatan berikut:
import pandas as pd df = pd.read_csv("test.csv") # Using logical indexing and overwrite assignment df.loc[df.ID == 103, 'FirstName'] = "Matt" df.loc[df.ID == 103, 'LastName'] = "Jones"
Kod ini menghiris DataFrame berdasarkan ID syarat == 103 untuk memilih baris dengan ID tersebut, kemudian menulis ganti nilai dalam lajur "FirstName" dan "LastName" dengan nilai yang dikehendaki.
Tugasan Berantai
Kaedah lain, walaupun kurang disyorkan, ialah tugasan berantai:
df['FirstName'][df.ID == 103] = "Matt" df['LastName'][df.ID == 103] = "Jones"
Pendekatan ini juga mengubah suai nilai berdasarkan keadaan penapisan, tetapi tidak digalakkan kerana ia boleh membawa kepada tingkah laku yang tidak dapat diramalkan dalam versi Pandas yang lebih baharu.
Kesimpulan
Dengan menggunakan teknik penugasan pengindeksan dan tulis ganti yang sesuai, Pandas membenarkan pengubahsuaian yang cekap bagi nilai tertentu berdasarkan pada kriteria yang sepadan, membolehkan manipulasi data kompleks serupa dengan yang mungkin dalam perisian statistik lain.
Atas ialah kandungan terperinci Bagaimanakah saya boleh mengubah suai nilai tertentu dalam Pandas DataFrame berdasarkan kriteria tertentu?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!