DataFrame 列文字列の効率的なクリーニング
DataFrame 列の文字列から望ましくない部分を削除することは、データ クリーニングの一般的なタスクです。これには、特定の文字、プレフィックス、またはサフィックスの削除が必要になる場合があります。
次のデータ構造を持つ DataFrame を考えてみましょう:
Time | Result |
---|---|
09:00 | 52A |
10:00 | 62B |
11:00 | 44a |
12:00 | 30b |
13:00 | -110a |
私たちの目標は、各 '結果から数値部分を抽出することです。 ' 文字列から、' ' および '-' 記号と末尾の文字を削除します。目的の出力は次のようになります。
Time | Result |
---|---|
09:00 | 52 |
10:00 | 62 |
11:00 | 44 |
12:00 | 30 |
13:00 | 110 |
これを実現するには、Python のラムダ関数を利用します。次のコードは、'Result' 列のデータを効果的にクリーンアップします:
data['Result'] = data['Result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))
このラムダ関数は、'Result' 列の各要素を反復処理します:
これらの操作を適用すると、「結果」列の文字列から不要な部分が削除され、目的の結果が得られます。
以上がPython の Lambda 関数を使用して DataFrame 列文字列を効率的にクリーンアップする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。