단일 파일에서 여러 JSON 개체 추출
여러 개체가 포함된 JSON 파일이 있는 상황에서 특정 필드를 격리하는 작업은 필수가 됩니다. 한 가지 접근 방식은 json.JSONDecoder.raw_decode 메서드를 활용하는 것입니다.
raw_decode는 대규모 JSON 문자열을 반복적으로 디코딩하는 기능을 제공합니다. 공백이 아닌 마지막 위치를 추적하면서 유효한 JSON 객체가 발견될 때까지 구문 분석을 계속합니다. 이를 통해 이전 끝 위치를 인수로 제공하여 raw_decode에 대한 반복 호출이 가능합니다.
그러나 Python의 JSON 모듈에는 공백 없는 입력이 필요합니다. 따라서 앞의 공백을 제거하기 위해서는 전처리가 필요합니다. 제공된 코드는 NOT_WHITESPACE 정규 표현식을 활용하여 비어 있지 않은 초기 문자를 찾음으로써 이 문제를 해결합니다.
<code class="python"># Extract Multiple JSON Objects from json import JSONDecoder, JSONDecodeError import re NOT_WHITESPACE = re.compile(r'\S') def decode_stacked(document, pos=0, decoder=JSONDecoder()): while True: match = NOT_WHITESPACE.search(document, pos) if not match: return pos = match.start() try: obj, pos = decoder.raw_decode(document, pos) except JSONDecodeError: # Handle error accordingly raise yield obj # Example usage s = """ {"a": 1} [ 1 , 2 ] """ for obj in decode_stacked(s): print(obj)</code>
출력은 입력 문자열에서 여러 JSON 개체를 성공적으로 추출한 것을 보여줍니다.
{'a': 1} [1, 2]
위 내용은 Python의 단일 파일에서 여러 JSON 개체를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!