Pandas replace() 関数が値を置換しない
Pandas の replace() メソッドのドキュメントには、出現するすべての値を置換すると記載されています。指定された値を別の値と組み合わせます。ただし、場合によっては、指定された引数が正しいように見えても、replace() メソッドが機能しないように見えます。
この考えられる理由の 1 つは、replace() メソッドがデフォルトで完全な置換検索を実行することです。部分的な置換を実行する場合は、regex パラメータを True に設定する必要があります。正規表現のサポートを有効にすると、replace() メソッドはターゲット値内の部分文字列を検索し、その部分文字列がすべて指定された置換値で置き換えられます。
例:
<code class="python">import pandas as pd d = {'color': pd.Series(['white', 'blue', 'orange']), 'second_color': pd.Series(['white', 'black', 'blue']), 'value': pd.Series([1., 2., 3.])} df = pd.DataFrame(d) df.replace('white', np.nan, regex=True)</code>
この変更により、セル内の位置に関係なく、文字列「white」が出現するすべてが NaN に置き換えられます。
正規表現パラメータの使用は、replace() のパフォーマンスに影響を与える可能性があることに注意することが重要です。特に大規模なデータセットを扱う場合には、この方法を使用します。したがって、必要な場合にのみ使用してください。
以上がPandas の「replace()」関数が常に期待どおりに動作しないのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。