JSON 行ファイルの解析: 複数の JSON オブジェクトのナビゲート
JSON ファイルを扱うとき、「余分なデータ」などのエラーが発生するとイライラすることがあります。特にドキュメントが分厚いと思われる場合。ただし、この場合、問題はファイル形式自体にあります。
ファイルは JSON Lines 形式であり、改行で区切られた個々の JSON オブジェクトで構成されています。この形式は、リストやオブジェクトのような最上位構造が欠けているため、有効な JSON 値として認識されません。
JSON Lines ファイルを正しく解析するには、各行を反復処理し、各オブジェクトを個別に解析する必要があります。 :
1 2 3 4 5 6 |
|
ファイル内の各行は有効な JSON オブジェクトであり、 json.loads() メソッドはそれを Python 辞書に変換します。このアプローチにより、各オブジェクトが段階的に処理され、メモリが節約され、潜在的なエラーが回避されます。
または、区切り文字で区切られた個々の JSON オブジェクトを含むファイルがある場合は、「「json」の使用方法」を参照してください。一度に 1 つの JSON オブジェクトを読み取るモジュール?](ドキュメントへのリンク)、バッファリングされたメソッドで個別に解析します。
以上が複数の JSON オブジェクトを含む JSON Lines ファイルを解析するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。