Permulaan Pantas: Kaedah Pandas membaca fail JSON memerlukan contoh kod khusus
Pengenalan:
Dalam bidang analisis data dan sains data, Pandas ialah salah satu perpustakaan Python yang penting. Ia menyediakan fungsi yang kaya dan struktur data yang fleksibel, serta boleh memproses dan menganalisis pelbagai data dengan mudah. Dalam aplikasi praktikal, kita sering menghadapi situasi di mana kita perlu membaca fail JSON. Artikel ini akan memperkenalkan cara menggunakan Panda untuk membaca fail JSON dan melampirkan contoh kod tertentu.
1. Pemasangan dan import Pandas
Untuk menggunakan perpustakaan Pandas, anda perlu memasangnya terlebih dahulu. Anda boleh menggunakan alat pip untuk memasang Pandas Perintahnya adalah seperti berikut:
pip install pandas
Selepas pemasangan selesai, anda boleh mengimport perpustakaan Pandas dalam skrip Python untuk membaca fail JSON
Gunakan Panda untuk membaca JSON Fail ini sangat mudah Anda hanya perlu memanggil fungsipd.read_json()
dan lulus dalam laluan fail JSON. Berikut ialah contoh: import pandas as pd
pd.read_json()
函数,传入JSON文件的路径即可。下面是一个示例:import pandas as pd # 读取JSON文件 df = pd.read_json('data.json')
这里假设我们有一个名为"data.json"的JSON文件,它包含了我们要处理的数据。
三、处理读取的数据
当Pandas成功读取JSON文件后,数据会被存储在一个数据帧(DataFrame)中。接下来,我们可以对这个数据帧进行各种操作和分析。
查看数据
我们可以使用head()
函数来查看数据的前几行,默认显示前5行。示例代码如下:
# 查看前5行数据 print(df.head())
如果要显示更多行,可以在head()
函数中传入一个整数参数,例如head(10)
表示显示前10行数据。
获取列名
使用columns
Lihat data
head()
untuk melihat beberapa baris pertama data 5 baris pertama dipaparkan secara lalai. Kod sampel adalah seperti berikut: # 获取列名 print(df.columns)
head()
, contohnya, head(10)</ code> bermaksud memaparkan data 10 baris pertama. </li><li><p><br>Dapatkan nama lajur</p>Gunakan atribut <kod>lajur
untuk mendapatkan senarai nama lajur bingkai data. Kod sampel adalah seperti berikut: # 选择特定的列 selected_columns = df[['column1', 'column2']] print(selected_columns)
Kita boleh menggunakan nama lajur bingkai data untuk memilih data. Kod sampel adalah seperti berikut:
# 筛选满足条件的记录 filtered_data = df[df['column1'] > 10] print(filtered_data)
Tapis data
import pandas as pd # 读取JSON文件 df = pd.read_json('data.json') # 查看前5行数据 print(df.head()) # 获取列名 print(df.columns) # 选择特定的列 selected_columns = df[['column1', 'column2']] print(selected_columns) # 筛选满足条件的记录 filtered_data = df[df['column1'] > 10] print(filtered_data)
Atas ialah kandungan terperinci Tutorial penggunaan Panda: Permulaan pantas untuk membaca fail JSON. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!