Dapatkan jenis data lajur dalam Pandas - Python

PHPz
Lepaskan: 2023-08-30 20:01:02
ke hadapan
1344 orang telah melayarinya

获取Pandas中列的数据类型 - Python

Pandas ialah perpustakaan Python yang popular dan berkuasa yang biasa digunakan untuk analisis dan manipulasi data. Ia menyediakan beberapa struktur data, termasuk Siri, DataFrame dan Panel, untuk bekerja dengan data jadual dan siri masa.

Pandas DataFrame ialah struktur data jadual dua dimensi. Dalam artikel ini, kami akan membincangkan pelbagai cara untuk menentukan jenis data lajur dalam Pandas. Terdapat banyak situasi di mana kita perlu mencari jenis data lajur dalam Pandas DataFrame. Setiap lajur dalam Pandas DataFrame boleh mengandungi jenis data yang berbeza.

Sebelum meneruskan, mari buat contoh kerangka data yang mana kita perlu mendapatkan jenis data lajur dalam Pandas

import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

print(df)
Salin selepas log masuk

Output

Skrip python ini mencetak DataFrame yang kami buat.

  Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000
Salin selepas log masuk

Kaedah yang boleh anda ambil untuk menyiapkan tugasan adalah seperti berikut

Kaedah

  • Gunakan atribut dtypes

  • Gunakan select_dtypes()

  • Gunakan kaedah info()

  • Gunakan fungsi describe()

Sekarang mari kita bincangkan setiap kaedah dan cara menggunakannya untuk mendapatkan jenis data lajur dalam Pandas.

Kaedah 1: Menggunakan atribut dtypes

Kita boleh menggunakan atribut dtypes untuk mendapatkan jenis data setiap lajur dalam DataFrame. Sifat ini akan mengembalikan siri yang mengandungi jenis data setiap lajur. Sintaks berikut boleh digunakan:

Tatabahasa

df.dtypes
Salin selepas log masuk

Jenis pengembalian Jenis data setiap lajur dalam DataFrame.

Algoritma

  • Import perpustakaan Pandas.

  • Buat DataFrame menggunakan fungsi pd.DataFrame() dan luluskan contoh sebagai kamus.

  • Gunakan sifat dtypes untuk mendapatkan jenis data setiap lajur dalam DataFrame.

  • Cetak keputusan untuk menyemak jenis data setiap lajur.

Contoh 1

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# get the data types of each column
print("\nData types of each column:")
print(df.dtypes)
Salin selepas log masuk

Output

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000

Data types of each column:
Vehicle name    object
price            int64
dtype: object
Salin selepas log masuk

Contoh 2

Dalam contoh ini, kami mendapat jenis data bagi satu lajur DataFrame

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# get the data types of column named price
print("\nData types of column named price:")
print(df.dtypes['price'])
Salin selepas log masuk

Output

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000

Data types of column named price:
int64
Salin selepas log masuk

Kaedah 2: Gunakan select_dtypes()

Kami boleh menggunakan kaedah select_dtypes() untuk menapis lajur jenis data yang kami perlukan. Kaedah select_dtypes() mengembalikan subset lajur berdasarkan jenis data yang disediakan sebagai input. Kaedah ini membolehkan kami memilih lajur yang tergolong dalam jenis data tertentu dan kemudian menentukan jenis data.

Algoritma

  • Import perpustakaan Pandas.

  • Gunakan fungsi pd.DataFrame() untuk mencipta DataFrame dan menghantar data yang diberikan sebagai kamus.

  • Cetak DataFrame untuk menyemak data yang dibuat.

  • Gunakan kaedah select_dtypes() untuk memilih semua lajur angka daripada DataFrame. Gunakan parameter sertakan untuk lulus senarai jenis data yang ingin kami pilih sebagai parameter.

  • Gelung pada lajur untuk mengulangi setiap lajur berangka dan mencetak jenis datanya.

Contoh

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# select the numeric columns
numeric_cols = df.select_dtypes(include=['float64', 'int64']).columns

# get the data type of each numeric column
for col in numeric_cols:
    print("Data Type of column", col, "is", df[col].dtype)
Salin selepas log masuk

Output

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000
Data Type of column price is int64
Salin selepas log masuk

Kaedah 3: Gunakan kaedah info()

Kami juga boleh menggunakan kaedah info() untuk menyelesaikan tugasan kami. Kaedah info() memberi kami ringkasan ringkas DataFrame, termasuk jenis data setiap lajur. Sintaks berikut boleh digunakan:

Tatabahasa

DataFrame.info(verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None)
Salin selepas log masuk

Nilai pulanganTiada

Algoritma

  • Import perpustakaan Pandas.

  • Buat DataFrame menggunakan fungsi pd.DataFrame() dan hantar data di atas sebagai kamus.

  • Cetak DataFrame untuk menyemak data yang dibuat.

  • Gunakan kaedah info() untuk mendapatkan maklumat tentang DataFrame.

  • Cetak maklumat yang diperolehi daripada kaedah info().

Contoh

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# use the info() method to get the data type of each column
print(df.info())
Salin selepas log masuk

Output

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
 #   Column        Non-Null Count  Dtype 
---  ------        --------------  ----- 
 0   Vehicle name  3 non-null      object
 1   price         3 non-null      int64 
dtypes: int64(1), object(1)
memory usage: 176.0+ bytes
None
Salin selepas log masuk

Kaedah 4: Gunakan fungsi describe()

Kaedah

describe() digunakan untuk menjana statistik deskriptif DataFrame, termasuk jenis data setiap lajur.

Algoritma

  • Gunakan penyata import untuk mengimport pustaka Pandas.

  • Gunakan fungsi pd.DataFrame() untuk mencipta DataFrame dan menghantar data yang diberikan sebagai kamus.

  • Cetak DataFrame untuk menyemak data yang dibuat.

  • Gunakan kaedah describe() untuk mendapatkan statistik deskriptif DataFrame.

  • Gunakan parameter sertakan kaedah describe() kepada 'semua' untuk memasukkan semua lajur dalam statistik deskriptif.

  • Gunakan sifat dtypes untuk mendapatkan jenis data setiap lajur dalam DataFrame.

  • Cetak jenis data setiap lajur.

Contoh

# import the Pandas library
import pandas as pd

# create a sample dataframe
df = pd.DataFrame({'Vehicle name': ['Supra', 'Honda', 'Lamorghini'],'price': [5000000, 600000, 7000000]})

# print the dataframe
print("DataFrame:\n", df)

# use the describe() method to get the descriptive statistics of the dataframe
desc_stats = df.describe(include='all')

# get the data type of each column 
dtypes = desc_stats.dtypes

# print the data type of each column
print("Data type of each column in the descriptive statistics:\n", dtypes)
Salin selepas log masuk

Output

DataFrame:
   Vehicle name    price
0        Supra  5000000
1        Honda   600000
2   Lamorghini  7000000
Data type of each column in the descriptive statistics:
 Vehicle name     object
price           float64
dtype: object
Salin selepas log masuk

Kesimpulan

Mengetahui cara mendapatkan jenis data setiap lajur, kami boleh menyelesaikan pelbagai operasi data dan kerja analisis dengan cekap. Setiap kaedah mempunyai kelebihan dan kekurangan yang tersendiri bergantung kepada kaedah atau fungsi yang digunakan. Anda boleh memilih kaedah yang anda mahukan berdasarkan betapa kompleksnya anda mahu ungkapan itu dan pilihan pengekodan peribadi anda.

Atas ialah kandungan terperinci Dapatkan jenis data lajur dalam Pandas - Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:tutorialspoint.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan