Pandas ialah perpustakaan Python yang popular dan berkuasa yang biasa digunakan untuk analisis dan manipulasi data. Ia menyediakan beberapa struktur data, termasuk Siri, DataFrame dan Panel, untuk bekerja dengan data jadual dan siri masa.
Pandas DataFrame ialah struktur data jadual dua dimensi. Dalam artikel ini, kami akan membincangkan pelbagai cara untuk menentukan jenis data lajur dalam Pandas. Terdapat banyak situasi di mana kita perlu mencari jenis data lajur dalam Pandas DataFrame. Setiap lajur dalam Pandas DataFrame boleh mengandungi jenis data yang berbeza.
Sebelum meneruskan, mari buat contoh kerangka data yang mana kita perlu mendapatkan jenis data lajur dalam Pandas
import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) print(df)
Skrip python ini mencetak DataFrame yang kami buat.
Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000
Kaedah yang boleh anda ambil untuk menyiapkan tugasan adalah seperti berikut
Gunakan atribut dtypes
Gunakan select_dtypes()
Gunakan kaedah info()
Gunakan fungsi describe()
Sekarang mari kita bincangkan setiap kaedah dan cara menggunakannya untuk mendapatkan jenis data lajur dalam Pandas.
Kita boleh menggunakan atribut dtypes untuk mendapatkan jenis data setiap lajur dalam DataFrame. Sifat ini akan mengembalikan siri yang mengandungi jenis data setiap lajur. Sintaks berikut boleh digunakan:
Tatabahasa
df.dtypes
Jenis pengembalian Jenis data setiap lajur dalam DataFrame.
Import perpustakaan Pandas.
Buat DataFrame menggunakan fungsi pd.DataFrame() dan luluskan contoh sebagai kamus.
Gunakan sifat dtypes untuk mendapatkan jenis data setiap lajur dalam DataFrame.
Cetak keputusan untuk menyemak jenis data setiap lajur.
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # get the data types of each column print("\nData types of each column:") print(df.dtypes)
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data types of each column: Vehicle name object price int64 dtype: object
Dalam contoh ini, kami mendapat jenis data bagi satu lajur DataFrame
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # get the data types of column named price print("\nData types of column named price:") print(df.dtypes['price'])
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data types of column named price: int64
Kami boleh menggunakan kaedah select_dtypes() untuk menapis lajur jenis data yang kami perlukan. Kaedah select_dtypes() mengembalikan subset lajur berdasarkan jenis data yang disediakan sebagai input. Kaedah ini membolehkan kami memilih lajur yang tergolong dalam jenis data tertentu dan kemudian menentukan jenis data.
Import perpustakaan Pandas.
Gunakan fungsi pd.DataFrame() untuk mencipta DataFrame dan menghantar data yang diberikan sebagai kamus.
Cetak DataFrame untuk menyemak data yang dibuat.
Gunakan kaedah select_dtypes() untuk memilih semua lajur angka daripada DataFrame. Gunakan parameter sertakan untuk lulus senarai jenis data yang ingin kami pilih sebagai parameter.
Gelung pada lajur untuk mengulangi setiap lajur berangka dan mencetak jenis datanya.
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # select the numeric columns numeric_cols = df.select_dtypes(include=['float64', 'int64']).columns # get the data type of each numeric column for col in numeric_cols: print("Data Type of column", col, "is", df[col].dtype)
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data Type of column price is int64
Kami juga boleh menggunakan kaedah info() untuk menyelesaikan tugasan kami. Kaedah info() memberi kami ringkasan ringkas DataFrame, termasuk jenis data setiap lajur. Sintaks berikut boleh digunakan:
Tatabahasa
DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None)
Nilai pulanganTiada
Import perpustakaan Pandas.
Buat DataFrame menggunakan fungsi pd.DataFrame() dan hantar data di atas sebagai kamus.
Cetak DataFrame untuk menyemak data yang dibuat.
Gunakan kaedah info() untuk mendapatkan maklumat tentang DataFrame.
Cetak maklumat yang diperolehi daripada kaedah info().
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # use the info() method to get the data type of each column print(df.info())
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 2 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Vehicle name 3 non-null object 1 price 3 non-null int64 dtypes: int64(1), object(1) memory usage: 176.0+ bytes None
describe() digunakan untuk menjana statistik deskriptif DataFrame, termasuk jenis data setiap lajur.
Gunakan penyata import untuk mengimport pustaka Pandas.
Gunakan fungsi pd.DataFrame() untuk mencipta DataFrame dan menghantar data yang diberikan sebagai kamus.
Cetak DataFrame untuk menyemak data yang dibuat.
Gunakan kaedah describe() untuk mendapatkan statistik deskriptif DataFrame.
Gunakan parameter sertakan kaedah describe() kepada 'semua' untuk memasukkan semua lajur dalam statistik deskriptif.
Gunakan sifat dtypes untuk mendapatkan jenis data setiap lajur dalam DataFrame.
Cetak jenis data setiap lajur.
# import the Pandas library import pandas as pd # create a sample dataframe df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]}) # print the dataframe print("DataFrame:\n", df) # use the describe() method to get the descriptive statistics of the dataframe desc_stats = df.describe(include='all') # get the data type of each column dtypes = desc_stats.dtypes # print the data type of each column print("Data type of each column in the descriptive statistics:\n", dtypes)
DataFrame: Vehicle name price 0 Supra 5000000 1 Honda 600000 2 Lamorghini 7000000 Data type of each column in the descriptive statistics: Vehicle name object price float64 dtype: object
Mengetahui cara mendapatkan jenis data setiap lajur, kami boleh menyelesaikan pelbagai operasi data dan kerja analisis dengan cekap. Setiap kaedah mempunyai kelebihan dan kekurangan yang tersendiri bergantung kepada kaedah atau fungsi yang digunakan. Anda boleh memilih kaedah yang anda mahukan berdasarkan betapa kompleksnya anda mahu ungkapan itu dan pilihan pengekodan peribadi anda.
Atas ialah kandungan terperinci Dapatkan jenis data lajur dalam Pandas - Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!