查詢資料幀列中的不同值
使用資料幀時,通常需要根據資料幀中的不同值來擷取行具體欄目。這使我們能夠消除重複值並獲得一組唯一的數據點。
考慮以下資料框:
COL1 COL2 a.com 22 b.com 45 c.com 34 e.com 45 f.com 56 g.com 22 h.com 45
假設我們要擷取與列中唯一值相對應的行COL2。為了實現這一點,我們可以利用 pandas 的 drop_duplicates 函數。此函數採用列名作為參數,並從資料框中刪除重複的行。
<code class="python">import pandas as pd df = pd.DataFrame(...) # assuming the given dataframe df = df.drop_duplicates('COL2')</code>
預設情況下,drop_duplicates 保留每個唯一值的第一次出現。或者,我們可以指定keep='last' 來保留最後一次出現的位置,或指定keep=False 來刪除所有重複的行:
<code class="python"># Keep first occurrence df = df.drop_duplicates('COL2', keep='first') # Keep last occurrence df = df.drop_duplicates('COL2', keep='last') # Remove all duplicates df = df.drop_duplicates('COL2', keep=False')</code>
執行上述任何命令後,資料幀df 將僅包含行對應於列COL2 中的不同值:
COL1 COL2 0 a.com 22 1 b.com 45 2 c.com 34 4 f.com 56
以上是如何根據資料幀列中的不同值提取行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!