중첩된 JSON을 Pandas DataFrame으로 읽기
중첩된 개체가 포함된 JSON 파일을 Pandas DataFrame으로 읽으려면 강력한 json_normalize를 활용할 수 있습니다. 기능. 이 기능을 사용하면 중첩된 데이터 구조를 표 형식으로 평면화하여 데이터를 더 쉽게 조작하고 분석할 수 있습니다.
배열을 열로 확장
샘플 JSON에는 다음이 포함됩니다. 위치의 배열. 이 배열을 JSON 열로 유지하는 대신 별도의 열로 확장하여 데이터에 대한 더 나은 통찰력을 얻을 수 있습니다. json_normalize는 메타 매개변수를 사용하여 이를 달성할 수 있습니다. 중첩 해제되어 DataFrame의 일반 열로 포함되어야 하는 열을 지정합니다.
<code class="python">import json with open('myJson.json') as data_file: data = json.load(data_file) df = pd.json_normalize(data, 'locations', ['date', 'number', 'name'], record_prefix='locations_', meta=['depTime', 'arrTime'])</code>
이 코드는 위치 배열에서 파생된 depTime 및 arrTime에 대한 추가 열이 있는 DataFrame을 생성합니다.
위치 열 가입
위치 열에 가입하고 싶다고 말씀하셨습니다. 다음 코드를 사용하여 이 작업을 수행할 수 있습니다.
<code class="python">df['locations'] = df.locations.apply(','.join)</code>
이렇게 하면 위치가 쉼표로 구분된 단일 문자열로 연결됩니다.
여러 JSON 개체 처리
JSON 파일에 여러 JSON 개체(한 줄에 하나씩)가 포함되어 있는 경우 다음 코드를 사용할 수 있습니다.
<code class="python">import pandas as pd # Read the JSON file into a list of dictionaries with open('myJson.json') as f: data = [json.loads(line) for line in f] # Convert the list of dictionaries to a DataFrame df = pd.DataFrame(data)</code>
그런 다음 위에서 설명한 것과 동일한 기술을 적용하여 중첩된 데이터를 정규화하고 결합할 수 있습니다.
json_normalize를 활용하면 중첩된 JSON 데이터를 pandas DataFrame으로 효율적으로 읽고, 평면화하고, 조작할 수 있어 데이터 분석 기능이 향상됩니다.
위 내용은 중첩된 JSON을 Pandas DataFrame으로 읽고 데이터 구조를 조작하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!