So identifizieren und zeigen Sie Unterschiede zwischen DataFrames einfach an

DDD
Freigeben: 2024-10-22 20:50:05
Original
290 Leute haben es durchsucht

How to Easily Identify and Display Differences Between DataFrames

Vergleichen Sie Datenrahmen und zeigen Sie Unterschiede nebeneinander an

Um Datendiskrepanzen zu identifizieren, besteht häufig die Notwendigkeit, zwei Datenrahmen zu vergleichen und markieren Sie die Änderungen zwischen ihnen. Betrachten Sie das folgende Beispiel:

"StudentRoster Jan-1":
id    Name   score                    isEnrolled           Comment
111   Jack   2.17                     True                 He was late to class
112   Nick   1.11                     False                Graduated
113   Zoe    4.12                     True

"StudentRoster Jan-2":
id    Name   score                    isEnrolled           Comment
111   Jack   2.17                     True                 He was late to class
112   Nick   1.21                     False                Graduated
113   Zoe    4.12                     False                On vacation
Nach dem Login kopieren

Um die gewünschte Ausgabe zu erzielen, ermitteln Sie zunächst die Zeilen, in denen Änderungen vorgenommen wurden:

ne = (df1 != df2).any(1)
Nach dem Login kopieren

Identifizieren Sie als Nächstes die spezifischen Einträge, die geändert wurden:

ne_stacked = (df1 != df2).stack()
changed = ne_stacked[ne_stacked]
changed.index.names = ['id', 'col']
Nach dem Login kopieren

Fahren Sie mit dem Extrahieren der ursprünglichen und aktualisierten Werte für die geänderten Einträge fort:

difference_locations = np.where(df1 != df2)
changed_from = df1.values[difference_locations]
changed_to = df2.values[difference_locations]
Nach dem Login kopieren

Stellen Sie abschließend die Unterschiede in einem benutzerfreundlichen Tabellenformat dar:

pd.DataFrame({'from': changed_from, 'to': changed_to}, index=changed.index)
Nach dem Login kopieren

Dieser Ansatz bietet eine umfassende Zusammenfassung der Unterschiede zwischen zwei Datenrahmen, hebt sowohl die geänderten Werte als auch ihre Positionen hervor und ermöglicht so eine schnelle und effiziente Analyse von Datendiskrepanzen.

Das obige ist der detaillierte Inhalt vonSo identifizieren und zeigen Sie Unterschiede zwischen DataFrames einfach an. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!