Pandas DataFrame での部分的な文字列の一致の検索
テキスト データを扱う場合、部分的な文字列基準に基づいて pandas DataFrame をフィルタリングすることが必要になることがよくあります。この記事では、強力な Series.str メソッドを使用してこの操作を実行する方法を説明します。
文字列値の列を持つ DataFrame を考えてみましょう。部分的な文字列の一致に基づいて行をフィルターするには、次の構文を使用します。
df[df['column_name'].str.contains("partial_string")]
str.contains() メソッドは正規表現パターンを受け取り、指定された列の各セルが条件を満たすかどうかを示すブール値の DataFrame を返します。 pattern.
たとえば、name 列に部分文字列「John」が含まれる DataFrame 内のすべての行を検索するには、次のコマンドを使用します。 code:
df[df['name'].str.contains("John")]
このメソッドは pandas バージョン 0.8.1 以降と互換性があり、DataFrame 操作で部分文字列一致を実行する効率的な方法を提供します。
以上がPandas DataFrame で部分的な文字列の一致を見つけるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。