按子字符串条件过滤 Pandas DataFrame
假设您有一个 DataFrame,其中有一列包含字符串值。您可能会遇到需要根据部分字符串匹配来选择行,类似于在正则表达式中使用习惯用法 re.search(pattern, cell_in_question)。虽然熟悉语法 df[df['A'] == "hello world"],但找到一种方法来实现部分字符串匹配(例如“hello”)可能具有挑战性。
解决方案在于利用向量化字符串方法,特别是Series.str。通过采用这种方法,您可以执行以下操作:
df[df['A'].str.contains("hello")]
这行代码将返回 DataFrame 中“A”列中包含子字符串“hello”的行的子集。需要注意的是,此功能在 Pandas 0.8.1 版本及后续版本中可用。
以上是如何根据子字符串匹配过滤 Pandas DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!