Pandas の文字列から数値を抽出する
Pandas データ フレーム内の文字列から数値を抽出するには、str.extract メソッドの利用を検討してください。このメソッドでは、正規表現を使用して、データ フレームの文字列値から特定のパターンを抽出できます。
この例では、df データ フレームには、数値を含む文字列など、データ型が混在した列 'A' が含まれています。数値のみを抽出するには、正規表現キャプチャ グループを使用できます。
<code class="python">df.A.str.extract('(\d+)')</code>
正規表現パターン (d ) は、1 つ以上の数字 (d) に一致するキャプチャ グループを指定します。これにより、各文字列内の数値が分離されます。
結果は、抽出された数値を含む新しいデータ フレーム列です。
A 0 1 1 NaN 2 10 3 100 4 0
このメソッドは整数に対してのみ機能し、浮動小数点数には機能しないことに注意してください。 。より複雑なパターンや、数字が数字以外で区切られている場合には、追加の正規表現構文が必要になる場合があります。
以上がstr.extract() を使用してパンダの文字列から数値を抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。