Pandas replace() メソッドが機能しない?この簡単な修正をお試しください
replace() メソッドを使用して Pandas DataFrame 内の文字列を置換しようとすると、置換が行われないという不可解な問題が発生する可能性があります。複雑な置換とは対照的に、この状況には単純な置換の試行が含まれることがよくあります。
説明のために、次のデータフレームを調べてみましょう:
d = {'color' : pd.Series(['white', 'blue', 'orange']), 'second_color': pd.Series(['white', 'black', 'blue']), 'value' : pd.Series([1., 2., 3.])} df = pd.DataFrame(d)
出現するすべての「white」を次のデータフレームに置換しようとすると、 NaN、驚くべきことに、何も起こりません:
df.replace('white', np.nan)
出力は変更されません:
color second_color value 0 white white 1 1 blue black 2 2 orange blue 3
それで、何が問題だったのでしょうか?
replace() が原因であることがわかります。このメソッドはデフォルトで完全置換検索を実行します。部分置換を有効にするには、正規表現パラメータを True に設定する必要があります:
df.replace('white', np.nan, regex=True)
または、置換プロセスをより詳細に制御できる str.replace() メソッドを使用することもできます:
df['color'].str.replace('white', np.nan)
ボーナスヒント: inplace=True を使用して置換をインプレースで実行することを検討している場合は、その注意点を必ず理解してください。
以上が私のパンダの「replace()」メソッドが単純な文字列置換に機能しないのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。