比較兩個 DataFrame 時如何有效辨識 Pandas DataFrame 中的唯一行？-Python教學-PHP中文網

首頁

後端開發

Python教學

比較兩個 DataFrame 時如何有效辨識 Pandas DataFrame 中的唯一行？

Barbara Streisand

Dec 15, 2024 pm 09:07 PM

How to Efficiently Identify Unique Rows in Pandas DataFrames When Comparing Two DataFrames?

取得Pandas DataFrame 中的唯一行

給定兩個Pandas 資料幀，通常需要識別僅存在於其中一個資料幀中的行。這可以透過利用合併操作來有效地實現。

例如，考慮以下資料幀：

df1 = pd.DataFrame(data={'col1': [1, 2, 3, 4, 5, 3], 'col2': [10, 11, 12, 13, 14, 10]})
df2 = pd.DataFrame(data={'col1': [1, 2, 3], 'col2': [10, 11, 12]})

登入後複製

要從 df1 取得 df2 中不存在的行，我們可以執行df1 和 df2 之間的左連接。為了確保 df1 中的每一行與 df2 中的一行完全匹配，我們需要先從 df2 中刪除重複的行。我們可以使用 drop_duplicates() 函數來做到這一點。

df_all = df1.merge(df2.drop_duplicates(), on=['col1', 'col2'], how='left', indicator=True)

登入後複製

產生的df_all 資料幀將有一個名為_merge 的附加列，指示每一行是否來自df1 和df2（「兩者」），來自僅df1（'left_only'），或僅來自df2 ('right_only').

   col1  col2     _merge
0     1    10       both
1     2    11       both
2     3    12       both
3     4    13  left_only
4     5    14  left_only
5     3    10  left_only

登入後複製

要從df1 提取df2中不存在的行，我們只需選擇_merge 等於'left_only' 的行即可：

rows_not_in_df2 = df_all[df_all['_merge'] == 'left_only']

登入後複製

   col1  col2
0     4    13
1     5    14
2     3    10

登入後複製

避免錯誤方法

重要的是要避免無法將行視為一個整體的錯誤解決方案。一些解決方案僅檢查一行中的每個單獨值是否存在於另一個資料框中，這可能會導致不正確的結果。

例如，如果我們向df1 增加了另一行資料[3, 10]，其中也存在於df2 中，不正確的方法仍會將其識別為不存在於df2 中，因為它在兩列中具有不同的值。但是，我們的方法將正確地將其識別為不存在，因為它已經在 df2 中，並且兩列的值相同。

以上是比較兩個 DataFrame 時如何有效辨識 Pandas DataFrame 中的唯一行？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7749

Java教學

1643

CakePHP 教程

1397

Laravel 教程

1291

PHP教程

1234

Related knowledge

如何解決Linux終端中查看Python版本時遇到的權限問題？ Apr 01, 2025 pm 05:09 PM

Linux終端中查看Python版本時遇到權限問題的解決方法當你在Linux終端中嘗試查看Python的版本時，輸入python...

如何在使用 Fiddler Everywhere 進行中間人讀取時避免被瀏覽器檢測到？ Apr 02, 2025 am 07:15 AM

使用FiddlerEverywhere進行中間人讀取時如何避免被檢測到當你使用FiddlerEverywhere...

在Python中如何高效地將一個DataFrame的整列複製到另一個結構不同的DataFrame中？ Apr 01, 2025 pm 11:15 PM

在使用Python的pandas庫時，如何在兩個結構不同的DataFrame之間進行整列複製是一個常見的問題。假設我們有兩個Dat...

如何在10小時內通過項目和問題驅動的方式教計算機小白編程基礎？ Apr 02, 2025 am 07:18 AM

如何在10小時內教計算機小白編程基礎？如果你只有10個小時來教計算機小白一些編程知識，你會選擇教些什麼�...

Uvicorn是如何在沒有serve_forever()的情況下持續監聽HTTP請求的？ Apr 01, 2025 pm 10:51 PM

Uvicorn是如何持續監聽HTTP請求的？ Uvicorn是一個基於ASGI的輕量級Web服務器，其核心功能之一便是監聽HTTP請求並進�...

FastAPI中如何處理逗號分隔的列表查詢參數？ Apr 02, 2025 am 06:51 AM

fastapi ...

在Linux終端中使用python --version命令時如何解決權限問題？ Apr 02, 2025 am 06:36 AM

Linux終端中使用python...

如何繞過Investing.com的反爬蟲機制獲取新聞數據？ Apr 02, 2025 am 07:03 AM

攻克Investing.com的反爬蟲策略許多人嘗試爬取Investing.com（https://cn.investing.com/news/latest-news）的新聞數據時，常常�...

See all articles

比較兩個 DataFrame 時如何有效辨識 Pandas DataFrame 中的唯一行？

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題