Menilai Ungkapan Secara Dinamik daripada Formula Menggunakan Panda
Masalah:
Nilai ungkapan aritmetik menggunakan pd.eval sambil mengambil kira pembolehubah, keutamaan operator dan struktur kompleks bingkai data.
Jawapan:
1. Menggunakan pd.eval
pd.eval(
"df1.A + (df1.B * x)",
local_dict={"x": 5},
target=df2,
parser="python",
engine="numexpr",
)
Salin selepas log masuk
Argumen:
-
ungkapan: Formula untuk menilai sebagai rentetan.
-
local_dict: Kamus yang mengandungi pembolehubah yang tidak ditakrifkan dalam ruang nama global.
-
sasaran: Kerangka data untuk menetapkan hasil.
-
penghuraikan: Menentukan penghurai yang digunakan untuk menghuraikan ungkapan (pandas atau python).
-
enjin: Menentukan hujung belakang yang digunakan untuk menilai ungkapan (numexpr atau python ).
2. Menggunakan df.eval
df1.eval(
"A + (B * @x)",
target=df2,
parser="python",
engine="numexpr",
)
Salin selepas log masuk
Argumen:
- df: Bingkai data di mana ungkapan sedang dinilai.
- ungkapan: Formula untuk menilai sebagai rentetan.
- sasaran: Kerangka data untuk menetapkan hasil.
- penghuraikan: Menentukan penghurai yang digunakan untuk menghuraikan ungkapan (pandas atau ular sawa).
- enjin: Menentukan bahagian belakang yang digunakan untuk menilai ungkapan (numexpr atau python).
3. Perbezaan antara pd.eval dan df.eval
- pd.eval menilai ungkapan pada sebarang objek, manakala df.eval menilai ungkapan secara khusus pada bingkai data.
- df.eval memerlukan nama lajur terdahulu dengan simbol at (@) untuk mengelakkan kekeliruan, manakala pd.eval tidak.
- df.eval boleh mengendalikan ungkapan berbilang baris dengan tugasan, manakala pd.eval tidak boleh.
Nota tambahan:
- Pastikan ungkapan disertakan dalam petikan berganda.
- x = 5 memberikan nilai 5 kepada pembolehubah x dalam ruang nama global .
- parser='python' disyorkan apabila berurusan dengan peraturan keutamaan pengendali Python dan ungkapan kompleks.
- target=df2 memastikan keputusan diberikan kepada bingkai data yang ditentukan.
- engine='numexpr' menggunakan enjin numexpr yang dioptimumkan untuk prestasi yang lebih baik.
- inplace=True boleh digunakan untuk mengubah suai kerangka data asal yang ada.
- df.query juga boleh digunakan untuk ungkapan bersyarat , mengembalikan baris yang memenuhi kriteria yang ditentukan.
Atas ialah kandungan terperinci Bagaimanakah saya boleh menilai secara dinamik ungkapan aritmetik dalam Pandas DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!