Pandas で数値以外の文字列から数値を抽出するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-10-24 14:15:02
オリジナル
655 人が閲覧しました

How to Extract Numbers from Non-Numeric Strings in Pandas?

Pandas: 文字列から数値を抽出する

Pandas でデータ フレームを操作する場合、多くの場合、非データ フレームが含まれるセルから数値情報を抽出する必要があります。 -数字。これは難しいかもしれませんが、Pandas はこれを達成するのに役立ついくつかのメソッドを提供します。

数値抽出に str.extract() を使用する

数値を抽出する効果的な方法の 1 つ文字列は str.extract() です。このメソッドを使用すると、キャプチャする数値データを定義する正規表現パターンを指定できます。

次のデータ フレームを考えてみましょう:

<code class="python">import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
                   })
print(df)</code>
ログイン後にコピー

出力:

    A
0   1a
1   NaN
2   10a
3   100b
4   0b
ログイン後にコピー

各セルから数値を抽出するには、次の正規表現を使用できます。

<code class="python">df.A.str.extract('(\d+)')</code>
ログイン後にコピー

正規表現パターン (d ) は、1 つ以上の任意の数字のシーケンスをキャプチャします。パターンを囲む括弧は、文字列の一致部分を返すために使用されるキャプチャ グループを作成します。

出力:

0      1
1    NaN
2     10
3    100
4      0
Name: A, dtype: object
ログイン後にコピー

ご覧のとおり、目的の数値が正常に取得されました。数値以外の文字を含むセルも含めて、各セルから抽出されます。このメソッドは整数に対してのみ機能し、浮動小数点数に対しては機能しないことに注意してください。

以上がPandas で数値以外の文字列から数値を抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!