メモリを破壊せずに非常に大きな JSON ファイルを読み取る
標準の Python メソッドを使用して大量の JSON ファイルをメモリに直接読み込もうとすると、「メモリエラー。」これは、これらのメソッドが解析する前にファイル全体を読み取ろうとし、過剰なメモリを消費するために発生します。
この問題を解決するには、ファイルをストリームとして段階的に処理し、即時処理するために一度に一部を読み込む必要があります。 ijson は、この目的に役立つライブラリであり、ストリーミング JSON パーサーを提供します。
ijson を使用して大きな JSON ファイルをストリーミングする方法の例を次に示します。
<code class="python">import ijson with open('large_file.json', 'r', encoding='utf-8') as f: parser = ijson.parse(f) for prefix, event, value in parser: # Process the current event and value if prefix and event == 'map_key': # Handle the key for a new object key = value elif event == 'string': # Handle the value for a string val = value</code>
反復するにつれてストリームを通じて、メモリ制限を超えることなくデータを段階的に処理できます。 json-streamer や bigjson など、説明で言及されている他のライブラリも同様の機能を提供します。これらのツールを利用すると、メモリ エラーが発生することなく、非常に大きな JSON ファイルを効果的に処理できます。
以上が以下にいくつかのタイトル オプションを示します。これらは質問ベースになるように調整されており、大きな JSON ファイルの処理に重点を置いた記事を反映しています。 オプション 1 (より一般的な): * 非常に大きな JSON ファイルを処理する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。