如何將兩個具有重疊列的 Pandas DataFrame 組合在一起?

Mary-Kate Olsen
發布: 2024-10-24 19:07:29
原創
908 人瀏覽過

How Can You Combine Two Pandas DataFrames with Overlapping Columns?

組合 Pandas 資料框:在公共資料列上連接

Joinder 是基於公共屬性合併資料框的基本操作。本問題研究組合兩個 pandas 資料框的問題:restaurant_ids_dataframe 和restaurant_review_frame。

使用者嘗試利用 DataFrame.join() 方法使用business_id 欄位執行左連線。但是,由於列(business_id、stars 和 type)重疊,會出現錯誤。為了解決這個問題,我們可以使用 merge 函數:

<code class="python">import pandas as pd

pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')</code>
登入後複製

on 參數指定用於連接的欄位名稱,而 how 參數定義連接類型(outer、inner、left 或 right) )。在這種情況下,選擇外部作為兩個資料幀中鍵的並集。

請注意,兩個資料幀都包含名為 star 的欄位。預設情況下,合併作業會將後綴附加到列名稱(star_x 和 star_y)。要自訂這些後綴,我們可以使用 suffixes 關鍵字參數:

<code class="python">pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))</code>
登入後複製

透過此修改,星列將被重新命名為 star_restaurant_id 和 star_restaurant_review。透過利用合併功能並適當地配置聯結類型和列後綴,我們可以根據共享的business_id列成功組合兩個資料框。

以上是如何將兩個具有重疊列的 Pandas DataFrame 組合在一起?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!