从 Pandas 中的字符串中提取数字
要从 Pandas 数据框中的字符串中提取数字,请考虑使用 str.extract 方法。此方法允许使用正则表达式从数据框的字符串值中提取特定模式。
在提供的示例中,df 数据框包含具有混合数据类型的列“A”,包括包含数字的字符串。要仅提取数字,可以使用正则表达式捕获组:
<code class="python">df.A.str.extract('(\d+)')</code>
正则表达式模式 (d ) 指定与一个或多个数字 (d) 匹配的捕获组。这将隔离每个字符串中的数字。
结果是一个包含提取的数字的新数据框列:
A 0 1 1 NaN 2 10 3 100 4 0
请注意,此方法仅适用于整数,不适用于浮点数。对于更复杂的模式或数字由非数字分隔的情况,可能需要额外的正则表达式语法。
以上是如何使用 str.extract() 从 Pandas 中的字符串中提取数字?的详细内容。更多信息请关注PHP中文网其他相关文章!