Dalam artikel ini kami akan menunjukkan kepada anda perbezaan antara bingkai data dan matriks dalam python panda.
Bingkai dan matriks data ialah kedua-dua struktur data dua dimensi. Secara umumnya, bingkai data boleh mengandungi berbilang jenis data (nombor, aksara, faktor, dll.), manakala matriks hanya boleh menyimpan satu jenis data.
Dalam Python, DataFrame ialah struktur data dua dimensi, jadual, boleh ubah yang boleh menyimpan data jadual yang mengandungi objek pelbagai jenis data. DataFrame mempunyai paksi yang dilabelkan dalam baris dan lajur. DataFrames ialah alat yang berguna dalam prapemprosesan data kerana ia menyediakan kaedah manipulasi data yang berharga. DataFrame juga boleh digunakan untuk mencipta jadual pangsi dan plot data menggunakan Matplotlib.
Bingkai data boleh melakukan pelbagai tugas seperti memasukkan formula statistik.
Pemprosesan data (Matriks tidak mungkin, mesti ditukar kepada bingkai data dahulu)
Tukar baris kepada lajur dan sebaliknya, sangat berguna dalam sains data.
Berikut adalah algoritma/langkah yang perlu diikuti untuk melaksanakan tugas yang diperlukan -
Gunakan kata kunci import untuk mengimport modul panda, numpy dengan alias.
Gunakan fungsi DataFrame() modul panda untuk mencipta bingkai data.
Cetak bingkai data input.
Atur cara berikut menggunakan fungsi DataFrame() untuk mengembalikan bingkai data -
# importing pandas, numpy modules with alias names import pandas as pd import numpy as np # creating a dataframe inputDataframe = pd.DataFrame({'Name': ['Virat', 'Rohit', 'Meera', 'Nick', 'Sana'], 'Jobrole': ['Developer', 'Analyst', 'Help Desk', 'Database Developer', 'Finance accountant'], 'Age': [25, 30, 28, 25, 40]}) # displaying the dataframe print(inputDataframe)
Apabila dilaksanakan, program di atas akan menjana output berikut -
Name Jobrole Age 0 Virat Developer 25 1 Rohit Analyst 30 2 Meera Help Desk 28 3 Nick Database Developer 25 4 Sana Finance accountant 40
Matriks ialah koleksi set data homogen yang disusun dalam grid segi empat tepat dua dimensi. Ia ialah tatasusunan m*n dengan jenis data yang sama. Ia dicipta dengan input vektor. Terdapat bilangan baris dan lajur yang tetap. Python menyokong pelbagai operasi aritmetik seperti penambahan, penolakan, pendaraban dan pembahagian pada Matriks.
Ia sangat berguna dalam ekonomi untuk mengira statistik seperti KDNK (Keluaran Dalam Negara Kasar) atau PI (Pendapatan Harga per Kapita).
Ia juga berguna untuk mengkaji litar elektrik dan elektronik.
Cetak bingkai data input.
Matriks digunakan untuk penyelidikan, seperti melukis graf.
Ini berguna dalam kebarangkalian dan statistik.
Berikut adalah algoritma/langkah yang perlu diikuti untuk melaksanakan tugas yang diperlukan -
Gunakan kata kunci import untuk mengimport modul pandas dengan alias.
Buat dua pembolehubah untuk menyimpan dua matriks input masing-masing.
Buat bingkai data untuk matriks pertama dan kedua menggunakan fungsi DataFrame() (Buat DataFrame) modul panda dan simpannya dalam pembolehubah berasingan. Data ini dimuatkan ke dalam DataFrames panda.
Cetak bingkai data matriks input 1.
Cetak dimensi (bentuk) matriks input 1 dengan menggunakan atribut shape.
Cetak bingkai data matriks input 2.
Cetak dimensi (bentuk) matriks input 2 dengan menggunakan atribut shape.
Gunakan fungsi dot() untuk mendarab matriks inputMatrix_1 dan inputMatrix_2 dan buat pembolehubah untuk menyimpannya.
Cetak matriks hasil pendaraban matriks inputMatrix_1 dan inputMatrix_2.
Cetak dimensi (bentuk) matriks yang terhasil dengan menggunakan atribut bentuk.
Atur cara berikut menggunakan fungsi DataFrame() untuk mengembalikan bingkai data -
# importing pandas module import pandas as pd # input matrix 1 inputMatrix_1 = [[1, 2, 2], [1, 2, 0], [1, 0, 2]] # input matrix 2 inputMatrix_2 = [[1, 0, 1], [2, 1, 1], [2, 1, 2]] # creating a dataframe of first matrix #(here data is loaded into a pandas DataFrames) df_1 = pd.DataFrame(data=inputMatrix_1) # creating a dataframe of second matrix df_2 = pd.DataFrame(data=inputMatrix_2) # printing the dataframe of input matrix 1 print("inputMatrix_1:") print(df_1) # printing the dimensions(shape) of input matrix 1 print("The dimensions(shape) of input matrix 1:") print(df_1.shape) print() # printing the dataframe of input matrix 2 print("inputMatrix_2:") print(df_2) # printing the dimensions(shape) of input matrix 1 print("The dimensions(shape) of input matrix 2:") print(df_2.shape) print() # multiplying both the matrices inputMatrix_1 and inputMatrix_2 result_mult = df_1.dot(df_2) # Printing the resultant of matrix multiplication of inputMatrix_1 and inputMatrix_2 print("Resultant Matrix after Matrix multiplication:") print(result_mult) # printing the dimensions(shape) of resultant Matrix print("The dimensions(shape) of Resultant Matrix:") print(result_mult.shape)
inputMatrix_1: 0 1 2 0 1 2 2 1 1 2 0 2 1 0 2 The dimensions(shape) of input matrix 1: (3, 3) inputMatrix_2: 0 1 2 0 1 0 1 1 2 1 1 2 2 1 2 The dimensions(shape) of input matrix 2: (3, 3) Resultant Matrix after Matrix multiplication: 0 1 2 0 9 4 7 1 5 2 3 2 5 2 5 The dimensions(shape) of Resultant Matrix: (3, 3)
Di bawah adalah jadual perbezaan antara matriks dan bingkai data.
Matriks | Bingkai Data |
---|---|
Ia adalah koleksi set data yang disusun dalam organisasi segi empat tepat dua dimensi | Ia menyimpan jadual data dengan berbilang jenis data dalam berbilang lajur yang dipanggil medan. |
Matriks ialah tatasusunan m*n dengan jenis data yang sama | Bingkai data ialah senarai vektor yang sama panjang. Bingkai data ialah bentuk umum bagi matriks. |
Matriks mempunyai bilangan baris dan lajur yang tetap. | Bilangan baris dan lajur Bingkai Data adalah berubah-ubah. |
Homogen | Heterogen |
Kami belajar tentang perbezaan antara matriks dan bingkai data dalam Python dalam aplikasi ini. Kami juga mempelajari cara membuat bingkai data dan cara menukar matriks kepada bingkai data.
Atas ialah kandungan terperinci Apakah perbezaan antara bingkai data dan matriks dalam Python Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!