Cara melakukan visualisasi dan penerokaan data dalam Python
Visualisasi dan penerokaan data ialah salah satu aspek penting dalam analisis data Dengan bantuan pelbagai perpustakaan dan alatan yang berkuasa dalam Python, kami boleh melakukan visualisasi dan penerokaan data dengan mudah. Artikel ini akan memperkenalkan perpustakaan dan teknik visualisasi data yang biasa digunakan dalam Python, dan memberikan contoh kod khusus.
Pertama, anda perlu memasang perpustakaan panda untuk pemprosesan dan analisis data. Kemudian, gunakan kod berikut untuk membaca set data Iris dan bersedia untuk visualisasi data mudah:
import panda sebagai pd
iris_data = pd.read_csv('iris.csv')
print(iris_data.head())
print(iris_data.info())
Mengambil panjang Sepal sebagai contoh, contoh kod untuk menggunakan perpustakaan Matplotlib untuk melukis histogram adalah seperti berikut:
import matplotlib.pyplot sebagai plt
plt.bar(iris_data' ], iris_data['Sepal length'])
plt.xlabel('Spesies') # Tetapkan label paksi-x
plt.ylabel('Sepal length') # Tetapkan label paksi-y
plt.title('Distribution panjang Sepal') # Tetapkan tajuk carta
plt.show()
Selain itu, anda juga boleh menggunakan perpustakaan Seaborn untuk melukis histogram dan plot kotak. Berikut ialah contoh kod untuk melukis histogram:
import seaborn sebagai sns
sns.histplot(data=iris_data, x='Sepal length', kde=True)
plt.xlabel('Sepal length' ) # Tetapkan label paksi-x
plt.ylabel('Count') # Tetapkan label paksi-y
plt.title('Taburan panjang Sepal') # Tetapkan tajuk carta
plt.show()
Mengambil panjang Sepal dan panjang Petal sebagai contoh, contoh kod untuk menggunakan perpustakaan Matplotlib untuk melukis plot serakan adalah seperti berikut:
plt.scatter(iris_data['Sepal length'], iris_data['Petal length' ])
plt.xlabel('Sepal length') # Tetapkan label paksi-x
plt.ylabel('Petal length') # Tetapkan label paksi-y
plt.title('Hubungan antara Panjang sepal dan panjang Petal') # Tetapkan Tajuk carta
plt.show()
Selain itu, anda juga boleh menggunakan perpustakaan Seaborn untuk melukis peta haba untuk menunjukkan korelasi antara pembolehubah. Berikut ialah contoh kod untuk melukis peta haba:
matriks_korelasi = iris_data[['Sepal length', 'Sepal width', 'Petal length', 'Petal width']]. corr( )
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()
sns.pairplot(iris_data, hue ='Species')
rajah = px.parallel_coordinates(iris_data, color='Species')
Ringkasan
Atas ialah kandungan terperinci Bagaimana untuk melakukan visualisasi dan penerokaan data dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!