包括的な変更分析のためにデータフレームを並べて比較する
2 つのデータフレーム間の不一致を強調表示するために、その必要性を排除する効率的な方法が存在します。面倒な行ごとおよび列ごとの比較に使用します。特定の Python Pandas 関数を活用することで、さまざまなデータ型 (int、float、boolean、string など) にわたる変更を正確に特定し、直感的な HTML テーブル形式で表示することができます。
まず、ブール関数 (df1 != df2).any(1) を使用して行が変更されました。次に、変更された特定のエントリを特定するには、ne_stacked = (df1 != df2).stack() を使用し、changed = ne_stacked[ne_stacked] を利用して変更されていない値を除外します。
実際に変更された値を取得するには値には、変更されたデータの場所を識別する、difference_locations = np.where(df1 != df2) が組み込まれます。 Changed_from = df1.values[difference_locations] を使用して、これらの場所で元のデータフレーム (df1) から値を抽出します。同様に、changed_to = df2.values[difference_locations] を使用して、2 番目のデータフレーム (df2) から対応する値を抽出します。
差異を包括的に表示するには、changed_from と Changed_to を列として組み合わせ、インデックスを設定してデータフレームを構築します。変更された変数と一致します。この DataFrame は、変更を明確に並べて表示し、各データ ポイントの元の値と更新された値の両方を強調表示します。
以上が詳細な変更分析のためにデータフレームを効率的に並べて比較するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。