识别包含特定子字符串的列
要定位名称包含指定子字符串而不需要精确匹配的列,可以采用迭代方法。这涉及检查每个列名称并识别那些满足搜索条件的列名称。
考虑一个具有列名称(例如“spike-2”、“hey spike”和“spiked-in”)的 DataFrame。要提取包含子字符串“spike”的列名称,可以使用以下Python代码:
<code class="python">import pandas as pd # Initialize data data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]} df = pd.DataFrame(data) # Iterate over column names and filter based on substring spike_cols = [col for col in df.columns if 'spike' in col] # Print resulting column names print(spike_cols)</code>
在此代码中:
或者,通过以下方式获取 DataFrame仅匹配列:
<code class="python">df2 = df.filter(regex='spike')</code>
这将创建仅包含名称包含“spike”的列的 df2。
以上是如何使用正则表达式迭代提取 pandas DataFrame 中匹配子字符串的列?的详细内容。更多信息请关注PHP中文网其他相关文章!