如何從 Pandas 中的非數字字串中提取數字?

Mary-Kate Olsen
發布: 2024-10-24 14:15:02
原創
655 人瀏覽過

How to Extract Numbers from Non-Numeric Strings in Pandas?

Pandas:從字串中提取數字

在 Pandas 中處理資料框時,通常需要從包含非-數字字元。這可能具有挑戰性,但 Pandas 提供了多種方法來幫助您實現這一目標。

使用 str.extract() 進行數位擷取

一種從字串是str.extract()。此方法可讓您指定定義要擷取的數字資料的正規表示式模式。

考慮以下資料框:

<code class="python">import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
                   })
print(df)</code>
登入後複製

輸出:

    A
0   1a
1   NaN
2   10a
3   100b
4   0b
登入後複製

要從每個單元格中提取數字,您可以使用以下正規表示式:

<code class="python">df.A.str.extract('(\d+)')</code>
登入後複製

正規表示式模式(d ) 擷取一個或多個數字的任何序列。模式兩邊的括號會建立一個捕獲組,用於傳回字串的匹配部分。

輸出:

0      1
1    NaN
2     10
3    100
4      0
Name: A, dtype: object
登入後複製

如您所見,所需的數字已成功獲取從每個單元格中提取,即使是那些包含非數字字符的單元格。請注意,此方法僅適用於整數,不適用於浮點數。

以上是如何從 Pandas 中的非數字字串中提取數字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!