Cara menggunakan Pandas untuk membaca data daripada pangkalan data
Pandas ialah alat analisis data yang berkuasa yang menyediakan fungsi manipulasi dan analisis data yang kaya. Dalam proses analisis data sebenar, kita selalunya perlu membaca data daripada pangkalan data untuk dianalisis. Artikel ini akan memperkenalkan cara menggunakan pustaka Pandas untuk membaca data daripada pangkalan data dan memberikan contoh kod khusus.
Pertama, kita perlu memastikan bahawa perpustakaan Pandas dan pemacu berkaitan pangkalan data telah dipasang. Dengan mengandaikan kami menggunakan pangkalan data MySQL, kami perlu memasang modul pymysql untuk menyambung ke pangkalan data. Kebergantungan yang berkaitan boleh dipasang menggunakan arahan berikut:
pip install pandas pip install pymysql
Seterusnya, kita perlu mengimport perpustakaan yang diperlukan:
import pandas as pd import pymysql
Kemudian, kita perlu menyambung ke pangkalan data. Kami perlu menyediakan maklumat berkaitan pangkalan data, seperti alamat pangkalan data, nama pengguna, kata laluan, dsb. Berikut ialah contoh menyambung ke pangkalan data MySQL tempatan:
# 连接到数据库 conn = pymysql.connect(host='localhost', user='root', password='password', database='database_name')
Selepas sambungan berjaya, kita boleh menggunakan pernyataan pertanyaan SQL untuk membaca data daripada pangkalan data. Pandas menyediakan fungsi read_sql() untuk melaksanakan pertanyaan SQL dan mengembalikan hasil. Berikut ialah contoh membaca keseluruhan jadual daripada pangkalan data:
# 从数据库中读取整张表 sql = "SELECT * FROM table_name" df = pd.read_sql(sql, conn)
Jika kita hanya mahu membaca sebahagian daripada data dalam jadual, kita boleh menggunakan klausa WHERE untuk menambah syarat. Berikut adalah contoh membaca data yang memenuhi syarat dari pangkalan data:
# 从数据库中读取满足条件的数据 sql = "SELECT * FROM table_name WHERE column_name = 'value'" df = pd.read_sql(sql, conn)
Selepas membaca data, kita boleh melakukan pelbagai operasi dan analisis pada data. Sebagai contoh, kita boleh melihat beberapa baris pertama data, maklumat asas tentang statistik, dsb. Berikut adalah beberapa contoh yang biasa digunakan:
# 查看数据的前几行 print(df.head()) # 统计数据的基本信息 print(df.describe()) # 计算某一列的平均值 print(df['column_name'].mean())
Selain contoh di atas, Pandas juga menyediakan sejumlah besar fungsi manipulasi dan analisis data, seperti penapisan data, pengisihan, pengelompokan, penggabungan, dsb. Anda boleh terus menggunakan fungsi ini mengikut keperluan sebenar.
Akhir sekali, selepas melengkapkan pembacaan dan analisis data, kita harus menutup sambungan ke pangkalan data untuk mengeluarkan sumber:
# 关闭与数据库的连接 conn.close()
Ringkasnya, artikel ini memperkenalkan cara menggunakan perpustakaan Pandas untuk membaca data daripada pangkalan data dan memberikan contoh kod Khusus disediakan. Dengan menggunakan fungsi berkuasa Pandas, kami boleh membaca data daripada pangkalan data dengan mudah dan melaksanakan pelbagai operasi dan analisis, meningkatkan kecekapan dan ketepatan analisis data.
Atas ialah kandungan terperinci Panduan membaca pangkalan data Pandas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!