部分文字列基準による Pandas DataFrame のフィルタリング
文字列値を含む列を持つ DataFrame があるとします。正規表現で re.search(pattern, cell_in_question) というイディオムを使用するのと同様に、文字列の部分一致に基づいて行を選択する必要が生じる場合があります。構文 df[df['A'] == "hello world"] には慣れていますが、「hello」などの部分文字列一致でこれを実現する方法を見つけるのは難しい場合があります。
解決策ベクトル化された文字列メソッド、特に Series.str を利用することにあります。このアプローチを採用すると、次の操作を実行できます。
df[df['A'].str.contains("hello")]
このコード行は、「A」列に部分文字列「hello」を含む DataFrame 内の行のサブセットを返します。この機能は Pandas バージョン 0.8.1 以降のバージョンで利用可能であることに注意することが重要です。
以上が部分文字列の一致に基づいて Pandas DataFrame をフィルターするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。