Pandas を使用してファイル全体を再ロードせずに Excel ワークブック内の特定のワークシートにアクセスする
大きな Excel ファイルを扱う場合、ロードが非効率になる可能性があります必要なワークシートが数枚だけの場合に、ワークブック全体を複数回実行します。 pd.read_excel() 関数を利用すると、ファイル全体を再ロードせずに、特定のワークシートを選択的にロードすることができます。
これを実現するには、pd.ExcelFile クラスの利用を検討してください。その方法は次のとおりです。
このシナリオでは、Excel ファイル全体が ExcelFile() 呼び出し中に 1 回だけロードされます。その後、各 pd.read_excel() 呼び出しは特定のシートをターゲットにし、不必要な再ロードを回避します。
pd.read_excel() のsheet_name 引数は、シートの名前、そのインデックスなどの値の範囲を受け入れることに注意することが重要です。 (例: 0、1...)、シート名またはインデックスのリスト、または None。リストが指定されている場合は、シート名/インデックスをキーとして、対応するデータ フレームを値として含む辞書が返されます。デフォルトの動作は、最初のシート (sheet_name=0) をフェッチすることです。
sheet_name として None を使用すると、ワークブック内のすべてのシートを {sheet_name: dataframe} ディクショナリとしてロードできます。このアプローチは、複数のシートにアクセスする必要がある場合に最適であり、ファイルを繰り返し読み込む必要がなくなります。
以上がPandas を使用してファイル全体を再ロードせずに特定の Excel ワークシートにアクセスするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。