データ処理スキル: pandas で行を削除する方法の詳細な説明
データ処理では、多くの場合、DataFrame 内のデータの特定の行を削除する必要があります。 Pandas は、行データの削除操作を実装するためのさまざまなメソッドを提供する強力なデータ処理ライブラリです。この記事では、パンダで行を削除する一般的な方法をいくつか詳しく紹介し、具体的なコード例を示します。
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为2的行数据 df = df.drop(2) print(df)
出力結果は次のとおりです:
Name Age Gender 0 Tom 20 M 1 Nick 25 M 3 David 35 M
ご覧のとおり、drop メソッドは新しい DataFrame を返し、データフレーム内の指定された行を削除します。結果。 。
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除所有年龄小于30的行数据 df = df[df['Age'] >= 30] print(df)
出力は次のとおりです:
Name Age Gender 2 John 30 M 3 David 35 M
ご覧のとおり、ブール インデックスを True または False に設定することで、行をフィルターで除外できます。保持する必要があるデータ。
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 删除索引为1到2的行数据 df = df.drop(df.index[1:3]) print(df)
出力結果は次のとおりです。
Name Age Gender 0 Tom 20 M 3 David 35 M
ご覧のとおり、スライス操作のインデックス範囲を設定することで、連続する複数のデータを削除できます。データの行。
import pandas as pd data = {'Name': ['Tom', 'Nick', 'John', 'David'], 'Age': [20, 25, 30, 35], 'Gender': ['M', 'M', 'M', 'M']} df = pd.DataFrame(data) # 设置第三行的索引为缺失 df.set_index(pd.Index(['0', '1', '3']), inplace=True) # 重置索引并删除缺失的行 df.reset_index(drop=True, inplace=True) print(df)
出力は次のとおりです。
Name Age Gender 0 Tom 20 M 1 Nick 25 M 2 David 35 M
欠落している行にインデックスを設定し、reset_index メソッドを使用して行をリセットすると、それがわかります。インデックスを付けて欠落している行を削除することで、特定の行を削除する操作を実装できます。
要約すると、pandas DataFrame で行データを削除する一般的な方法をいくつか紹介します。さまざまなニーズに応じて、データ処理タスクを完了するための適切な方法を選択できます。実際のアプリケーションでは、特定の状況に応じて適切な方法を選択して行データを削除し、データ処理の効率と精度を向上させることができます。
以上がpandas で行データを削除する手法を深く理解するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。