Warum zeigt die Pandas-Indizierung mit mehreren Bedingungen unerwartetes Verhalten?

Mary-Kate Olsen
Freigeben: 2024-10-25 09:47:02
Original
155 Leute haben es durchsucht

Why Does Pandas Indexing with Multiple Conditions Exhibit Unexpected Behavior?

Pandas Multiple Conditions Indexing: Unerwartetes Verhalten

Bei Pandas ist das Anwenden von Filtern auf einen DataFrame ein häufiger Vorgang. Bei Verwendung mehrerer Bedingungen, insbesondere bei logischen Operatoren wie AND und OR, können jedoch unerwartete Ergebnisse auftreten.

Problem:

Beim Filtern von Zeilen basierend auf Werten in zwei Spalten , scheint sich der AND-Operator wie OR zu verhalten und umgekehrt. Der folgende Code sollte beispielsweise:

  • Verwenden Sie den UND-Operator, um Zeilen auszuschließen, in denen einer der Spaltenwerte -1 ist.
  • Verwenden Sie den ODER-Operator, um Zeilen auszuschließen, in denen beide Spaltenwerte vorliegen -1.
<code class="python">df = pd.DataFrame({'a': range(5), 'b': range(5) })

df['a'][1] = -1
df['b'][1] = -1
df['a'][3] = -1
df['b'][4] = -1

df1 = df[(df.a != -1) & (df.b != -1)]
df2 = df[(df.a != -1) | (df.b != -1)]

print(pd.concat([df, df1, df2], axis=1,
                keys=['original df', 'using AND (&)', 'using OR (|)',]))</code>
Nach dem Login kopieren

Erklärung:

Das unerwartete Verhalten ist darauf zurückzuführen, wie die logischen Operatoren im Kontext der Pandas-Indizierung interpretiert werden.

  • AND-Operator:

    • df[(df.a != -1) & (df.b != -1)] bedeutet „Zeilen beibehalten, in denen df.a nicht -1 und df.b nicht -1 ist.“
    • Dies filtert Zeilen heraus, in denen mindestens ein Wert -1 ist.
  • OR-Operator:

    • df[(df.a != -1) | (df.b != -1)] bedeutet „Zeilen beibehalten, in denen entweder df.a oder df.b nicht -1 ist“.
    • Dies filtert Zeilen heraus, in denen beide Werte -1 sind.

Daher verhält sich der AND-Operator wie OR, da er Zeilen aufgrund des Fehlens von -1 in einer Spalte ausschließt. Umgekehrt verhält sich der OR-Operator wie AND, da er Zeilen nur dann einschließt, wenn beide Spalten nicht -1 enthalten.

Zusätzlicher Hinweis:

  • Die Verwendung wird empfohlen .loc und .iloc anstelle der verketteten Indizierung (z. B. df'a' = -1) für sauberere und sicherere Codepraktiken.

Das obige ist der detaillierte Inhalt vonWarum zeigt die Pandas-Indizierung mit mehreren Bedingungen unerwartetes Verhalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!