インデックスによる Pandas DataFrame の特定のセルの値の設定
Pandas を使用したデータ分析では、個々のセルの値を変更することが必要になることがよくありますデータフレーム内。これは、df などのさまざまな方法を使用して実現できます。 xs、df['column']、および df.at.
1。 df.xs (非推奨)
df.xs() メソッドを使用すると、DataFrame から特定の行を選択できます。ただし、返された行の列に値を代入しても、元のデータフレームは変更されません。代わりに、変更された行を含む新しいデータフレームが作成されます。例:
df.xs('C')['x'] = 10
2. df['column']
df['column'] を使用したチェーン インデックス作成は、指定された列のビューを返します。選択した列に値を割り当てると、元のデータフレームが直接変更されます。例:
df['x']['C'] = 10
3. df.at (推奨)
DataFrame 内の特定のセル値を設定するための推奨される方法は、df.at を使用することです。このメソッドは、行と列のインデックスを引数として受け取り、指定されたセルに新しい値を直接割り当てます。新しいデータフレームを作成せずに元のデータフレームを変更します。
df.at['C', 'x'] = 10
パフォーマンスに関する考慮事項
大規模なデータフレームの場合、パフォーマンスが重要になります。ベンチマークは、非推奨となった df.set_value が df['column'] と df.at の両方よりも大幅に高速であることを示しています。ただし、set_value は非推奨になっているため、今後は df.at を推奨メソッドとして使用する必要があります。
結論
Pandas DataFrame の特定のセルに値を設定するには、はさまざまな方法を使用して実現され、それぞれに独自の利点とパフォーマンス特性があります。新しいデータフレームの作成と既存のデータフレームの変更の違いを理解することが、適切な方法を選択する鍵となります。最高のパフォーマンスと保守性を実現するには、元の DataFrame を直接変更し、セル値を設定するための推奨方法である df.at を使用することをお勧めします。
以上が特定の Pandas DataFrame セルに値を効率的に設定するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。