部分文字列が一致する列の検索
特定の文字列を含む列を DataFrame にクエリすることは、便利な操作です。しかし、一致が正確ではなく、特定の部分文字列が含まれている場合はどうなるでしょうか?ここで正規表現フィルターが役に立ちます。
特定の文字列、特に連続した部分文字列を含む名前を持つ列を見つけるには、次の解決策を検討してください。
<code class="python">import pandas as pd # Create a DataFrame to demonstrate data = {'spike-2': [1, 2, 3], 'hey spke': [4, 5, 6], 'spiked-in': [7, 8, 9], 'no': [10, 11, 12]} df = pd.DataFrame(data) # Use regex filter to select columns with 'spike' substring spike_cols = df.filter(regex='spike').columns.tolist() # Print the column names with the matching substring print(spike_cols)</code>
このコードは、 DataFrame の列はリスト内包表記を使用し、正規表現フィルターを適用して「spike」部分文字列を持つ列を検索します。結果の列名のリストは、spike_cols 変数に保存され、必要に応じて対応する列にアクセスするために使用できます。
もう 1 つのアプローチは、列名をリストに変換し、それらを反復処理してそれぞれをテストすることです。 for ループと if ステートメントを使用した部分文字列一致の名前:
<code class="python"># Column names converted to a list col_list = list(df.columns) # Iterate over the column names for col in col_list: if 'spike' in col: # Column name with matching substring found print(col)</code>
これらのメソッドを使用すると、名前に特定の文字列が含まれるデータフレーム内の列を効率的に識別し、アクセスできます。完全一致。
以上がデータフレーム内の文字列が部分的に一致する列を抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。