Bagaimana untuk Menghuraikan Data JSON dengan Cekap dengan Pelbagai Objek Terbenam dalam Python?

Patricia Arquette
Lepaskan: 2024-10-29 12:32:29
asal
468 orang telah melayarinya

How to Efficiently Parse JSON Data with Multiple Embedded Objects in Python?

Cabaran Penghuraian JSON dengan Berbilang Objek Terbenam

Artikel ini menangani cabaran mengekstrak data daripada fail JSON yang mengandungi berbilang objek JSON bersarang. Fail sedemikian sering menimbulkan cabaran apabila berurusan dengan set data yang besar.

Pernyataan Masalah

Pertimbangkan fail JSON dengan berbilang objek JSON seperti berikut:

<code class="json">{"ID":"12345","Timestamp":"20140101", "Usefulness":"Yes",
 "Code":[{"event1":"A","result":"1"},…]}
{"ID":"1A35B","Timestamp":"20140102", "Usefulness":"No",
 "Code":[{"event1":"B","result":"1"},…]}
{"ID":"AA356","Timestamp":"20140103", "Usefulness":"No",
 "Code":[{"event1":"B","result":"0"},…]}
…</code>
Salin selepas log masuk

Tugasnya adalah untuk mengekstrak nilai "Timestamp" dan "Kebergunaan" daripada setiap objek ke dalam bingkai data:

Timestamp Usefulness
20140101 Yes
20140102 No
20140103 No
... ...

Gambaran Keseluruhan Penyelesaian

Untuk menangani cabaran ini, kami menggunakan kaedah json.JSONDecoder.raw_decode dalam Python . Kaedah ini membolehkan penyahkodan rentetan besar objek JSON "bertindan". Ia mengembalikan kedudukan terakhir objek yang dihuraikan dan objek yang sah. Dengan menghantar kembali kedudukan yang dikembalikan kepada raw_decode, kita boleh menyambung semula penghuraian dari titik itu.

Pelaksanaan

<code class="python">from json import JSONDecoder, JSONDecodeError
import re

NOT_WHITESPACE = re.compile(r'\S')

def decode_stacked(document, pos=0, decoder=JSONDecoder()):
    while True:
        match = NOT_WHITESPACE.search(document, pos)
        if not match:
            return
        pos = match.start()
        
        try:
            obj, pos = decoder.raw_decode(document, pos)
        except JSONDecodeError:
            # Handle errors appropriately
            raise
        yield obj

s = """

{“a”: 1}  


[
1
,   
2
]


"""

for obj in decode_stacked(s):
    print(obj)</code>
Salin selepas log masuk

Kod ini melelar melalui objek JSON dalam rentetan s dan mencetak setiap objek:

{'a': 1}
[1, 2]
Salin selepas log masuk

Kesimpulan

Penyelesaian yang disediakan secara berkesan menangani cabaran mengekstrak data daripada berbilang objek JSON bersarang yang dibenamkan dalam satu fail. Dengan menggunakan kaedah json.JSONDecoder.raw_decode dan mengendalikan kemungkinan ralat, kami boleh memproses set data yang besar dengan cekap. Fungsi decode_stacked boleh digunakan sebagai alat boleh guna semula untuk mengendalikan format fail sedemikian.

Atas ialah kandungan terperinci Bagaimana untuk Menghuraikan Data JSON dengan Cekap dengan Pelbagai Objek Terbenam dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!