Manipulasi data fail CSV menggunakan panda: langkah dan petua-Tutorial Python-php.cn

Rumah

pembangunan bahagian belakang

Tutorial Python

Manipulasi data fail CSV menggunakan panda: langkah dan petua

王林

Jan 10, 2024 am 11:54 AM

pandas Operasi data fail csv

Manipulasi data fail CSV menggunakan panda: langkah dan petua

Langkah dan teknik menggunakan panda untuk membaca fail CSV untuk manipulasi data

Pengenalan:
Dalam analisis dan pemprosesan data, selalunya perlu membaca data daripada fail CSV dan melaksanakan operasi dan analisis selanjutnya. panda ialah perpustakaan Python yang berkuasa yang menyediakan satu set alat untuk pemprosesan dan analisis data, menjadikannya mudah untuk memproses dan memanipulasi fail CSV. Artikel ini akan memperkenalkan langkah dan teknik membaca fail CSV berdasarkan panda, dan memberikan contoh kod khusus.

1. Import perpustakaan panda
Sebelum menggunakan perpustakaan panda, anda perlu mengimport perpustakaan terlebih dahulu. Kita boleh mencapai ini melalui kod berikut:

import panda sebagai pd

2. Membaca fail CSV
Membaca fail CSV ialah fungsi penting panda. panda menyediakan fungsi read_csv(), yang boleh membaca fail CSV ke dalam objek DataFrame untuk memudahkan operasi dan analisis data seterusnya. Berikut ialah contoh kod asas untuk membaca fail CSV:

data = pd.read_csv('file.csv')

Dalam kod di atas, 'file.csv' ialah laluan ke fail CSV yang anda mahu baca . Selepas membaca, data akan disimpan dalam objek DataFrame bernama data.

3. Lihat data
Selepas membaca fail CSV, kita boleh menggunakan fungsi head() untuk melihat beberapa baris pertama data. Ini sangat membantu dalam memahami struktur data dan keperluan untuk pembersihan data. Berikut ialah contoh kod untuk melihat data:

print(data.head())

Kod ini akan mengeluarkan lima baris pertama data dalam data.

4. Pemprosesan dan operasi data
pandas menyediakan pelbagai fungsi dan kaedah untuk memproses dan mengendalikan data. Beberapa teknik pemprosesan data yang biasa digunakan akan diperkenalkan di bawah.

4.1 Penapisan data
Kami boleh menggunakan fungsi penapisan bersyarat yang disediakan oleh panda untuk menapis data yang kami perlukan dengan cepat. Sebagai contoh, jika kita ingin mencari data yang "bandar"nya ialah "Beijing" dalam data, kita boleh menggunakan kod berikut:

filtered_data = data[data['city'] == 'Beijing']

Dalam kod di atas, data[' City'] == 'Beijing' mengembalikan Siri Boolean, yang mewakili sama ada setiap baris data memenuhi syarat. Kemudian, kami menggunakan Siri Boolean ini sebagai indeks untuk menapis data yang memenuhi syarat dan menyimpannya dalam data_filter.

4.2 Isih data
pandas menyediakan fungsi sort_values() untuk mengisih data. Berikut ialah contoh kod untuk mengisih data dalam tertib menurun mengikut lajur "jualan":

data_sort = data.sort_values(by='sales', ascending=False)

Kod di atas akan mengisih data mengikut lajur "jualan" Isih dalam tertib menurun dan simpan hasil yang diisih dalam data_isih.

4.3 Pengumpulan dan pengagregatan data
pandas menyediakan fungsi groupby() dan fungsi agg(), yang boleh melaksanakan operasi pengumpulan dan pengagregatan data dengan mudah. Berikut ialah contoh kod untuk mengumpulkan data mengikut lajur "Bandar" dan mengira jumlah jualan setiap bandar:

data_berkumpulan = data.groupby('City').agg({'Sales':'sum'})

Kod di atas akan mengumpulkan data mengikut lajur "Bandar" dan menggunakan fungsi agg() untuk mengira jumlah jualan setiap kumpulan (bandar). Hasilnya akan disimpan dalam data_kumpulan.

5 Output data
Selepas memproses data, kami boleh mengeluarkan data ke fail CSV atau fail format lain. Gunakan fungsi to_csv() panda untuk mengeluarkan objek DataFrame sebagai fail CSV. Berikut ialah contoh kod yang mengeluarkan data_kumpulan sebagai fail CSV:

data_kumpulan.to_csv('data_kumpulan.csv')

Kod di atas mengeluarkan data_kumpulan sebagai fail CSV bernama 'data_kumpulan.csv'.

Kesimpulan:
Artikel ini memperkenalkan langkah asas dan teknik biasa untuk menggunakan panda untuk membaca fail CSV untuk manipulasi data, dan menyediakan contoh kod khusus. Dengan menguasai kemahiran ini, anda boleh membaca dan memproses fail CSV dengan mudah serta melakukan analisis data dan operasi data dengan cepat. Menggunakan perpustakaan panda boleh meningkatkan kecekapan pemprosesan data, menjadikan analisis data berfungsi dengan lebih mudah dan cekap.

Atas ialah kandungan terperinci Manipulasi data fail CSV menggunakan panda: langkah dan petua. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7515

Tutorial CakePHP

1378

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Menyelesaikan masalah pemasangan panda biasa: tafsiran dan penyelesaian kepada ralat pemasangan Feb 19, 2024 am 09:19 AM

Tutorial pemasangan Pandas: Analisis ralat pemasangan biasa dan penyelesaiannya, contoh kod khusus diperlukan Pengenalan: Pandas ialah alat analisis data yang berkuasa yang digunakan secara meluas dalam pembersihan data, pemprosesan data dan visualisasi data, jadi ia sangat dihormati dalam bidang sains data. Walau bagaimanapun, disebabkan oleh konfigurasi persekitaran dan isu pergantungan, anda mungkin menghadapi beberapa kesukaran dan ralat semasa memasang panda. Artikel ini akan memberi anda tutorial pemasangan panda dan menganalisis beberapa ralat pemasangan biasa serta penyelesaiannya. 1. Pasang panda

Kaedah operasi terperinci untuk membandingkan fail CSV dengan Beyond Compare Apr 22, 2024 am 11:52 AM

Selepas memasang perisian BeyondCompare, pilih fail CSV untuk dibandingkan, klik kanan fail dan pilih pilihan [Bandingkan] dalam menu dikembangkan Sesi perbandingan teks akan dibuka secara lalai. Anda boleh mengklik bar alat sesi perbandingan teks untuk memaparkan butang [Semua [,] Perbezaan [, dan [Sama]] masing-masing untuk melihat perbezaan fail dengan lebih intuitif dan tepat. Kaedah 2: Buka BeyondCompare dalam mod perbandingan jadual, pilih sesi perbandingan jadual dan buka antara muka operasi sesi. Klik butang [Buka Fail] dan pilih fail CSV untuk dibandingkan. Klik butang tanda ketaksamaan [≠] pada bar alat antara muka operasi sesi perbandingan jadual untuk melihat perbezaan antara fail.

Apakah maksud petikan mata wang digital? Ketahui lebih lanjut tentang petikan mata wang digital dalam satu artikel Mar 26, 2024 am 09:51 AM

Bagi sesetengah pelabur baru yang baru memasuki bulatan mata wang, mereka akan sentiasa menghadapi beberapa perbendaharaan kata profesional semasa proses pelaburan ini dicipta untuk memudahkan pelaburan pelabur, tetapi pada masa yang sama, perbendaharaan kata ini juga mungkin agak Sukar untuk difahami. . Gambar mata wang digital yang kami perkenalkan kepada anda hari ini ialah konsep yang agak profesional dalam bulatan mata wang. Seperti yang kita semua tahu, pasaran Bitcoin berubah dengan cepat, jadi selalunya perlu mengambil gambar untuk memahami perubahan dalam pasaran dan proses operasi kami. Ramai pelabur mungkin masih tidak tahu apa yang dimaksudkan dengan gambar mata wang digital. Sekarang biarkan editor membawa anda melalui artikel untuk memahami petikan mata wang digital. Apakah maksud petikan mata wang digital? Gambar mata wang digital ialah momen pada rantaian blok tertentu (iaitu.

Bagaimana untuk membaca csv dalam python Mar 28, 2024 am 10:34 AM

Kaedah membaca: 1. Cipta fail contoh python; 2. Import modul csv, dan kemudian gunakan fungsi terbuka untuk membuka fail CSV 3. Hantar objek fail ke fungsi csv.reader, dan kemudian gunakan gelung untuk melintasi dan membaca setiap baris data 4. , hanya mencetak setiap baris data.

Bagaimana untuk menyelesaikan masalah aksara yang kacau apabila mengimport data Cina ke Oracle? Mar 10, 2024 am 09:54 AM

Tajuk: Kaedah dan contoh kod untuk menyelesaikan masalah aksara bercelaru apabila mengimport data Cina ke dalam Oracle Apabila mengimport data Cina ke pangkalan data Oracle, aksara bercelaru sering muncul Ini mungkin disebabkan oleh tetapan set aksara pangkalan data atau masalah penukaran pengekodan semasa import proses. . Untuk menyelesaikan masalah ini, kami boleh mengambil beberapa kaedah untuk memastikan data Cina yang diimport dapat dipaparkan dengan betul. Berikut ialah beberapa penyelesaian dan contoh kod khusus: 1. Semak tetapan set aksara pangkalan data Dalam pangkalan data Oracle, tetapan set aksara adalah

Bagaimana untuk membaca fail csv dengan pycharm Apr 03, 2024 pm 08:45 PM

Langkah-langkah untuk membaca fail CSV dalam PyCharm adalah seperti berikut: Import modul csv. Buka fail CSV menggunakan fungsi open(). Gunakan fungsi csv.reader() untuk membaca kandungan fail CSV. Lelaran melalui setiap baris dan dapatkan data medan sebagai senarai. Proses data dalam fail CSV, seperti pencetakan atau pemprosesan selanjutnya.

Bagaimana untuk mengeksport data yang ditanya dalam navicat Apr 24, 2024 am 04:15 AM

Eksport hasil pertanyaan dalam Navicat: Laksanakan pertanyaan. Klik kanan hasil pertanyaan dan pilih Eksport Data. Pilih format eksport seperti yang diperlukan: CSV: Pemisah medan ialah koma. Excel: Termasuk pengepala jadual, menggunakan format Excel. Skrip SQL: Mengandungi pernyataan SQL yang digunakan untuk mencipta semula hasil pertanyaan. Pilih pilihan eksport (seperti pengekodan, pemisah baris). Pilih lokasi eksport dan nama fail. Klik "Eksport" untuk memulakan eksport.

Tutorial pemasangan panda mudah: Panduan terperinci tentang cara memasang panda pada sistem pengendalian yang berbeza Feb 21, 2024 pm 06:00 PM

Tutorial pemasangan panda mudah: Panduan terperinci tentang cara memasang panda pada sistem pengendalian yang berbeza, contoh kod khusus diperlukan Memandangkan permintaan untuk pemprosesan dan analisis data terus meningkat, panda telah menjadi salah satu alat pilihan bagi ramai saintis data dan penganalisis. panda ialah pustaka pemprosesan dan analisis data yang berkuasa yang boleh memproses dan menganalisis sejumlah besar data berstruktur dengan mudah. Artikel ini akan memperincikan cara memasang panda pada sistem pengendalian yang berbeza dan memberikan contoh kod khusus. Pasang pada sistem pengendalian Windows

See all articles