


Quelle est la différence entre les trames de données et les matrices dans Python Pandas ?
Sep 14, 2023 pm 07:53 PMDans cet article, nous allons vous montrer la différence entre dataframe et matrice en python panda.
Les trames de données et les matrices sont toutes deux des structures de données bidimensionnelles. De manière générale, une trame de données peut contenir plusieurs types de données (nombres, caractères, facteurs, etc.), tandis qu'une matrice ne peut stocker qu' un type de données.
Cadres de données en Python
En Python, DataFrame est une structure de données bidimensionnelle, tabulaire et mutable qui peut stocker des données tabulaires contenant des objets de différents types de données. DataFrame a des axes étiquetés en lignes et en colonnes. Les DataFrames sont des outils utiles dans le prétraitement des données car ils fournissent des méthodes de traitement de données précieuses. DataFrame peut également être utilisé pour créer des tableaux croisés dynamiques et tracer des données à l'aide de Matplotlib.
Application Dataframe
Les trames de données peuvent effectuer diverses tâches telles que l'ajustement de formules statistiques.
Traitement des données (La matrice n'est pas possible, doit d'abord être convertie en trame de données)
Convertissez les lignes en colonnes et vice versa, très utile en science des données.
Créer un exemple de bloc de données
Algorithme (étapes)
Voici les algorithmes/étapes à suivre pour effectuer la tâche requise -
Utilisez le mot-clé import pour importer les modules pandas, numpy avec des alias.
Utilisez la fonction DataFrame() du module pandas pour créer un bloc de données.
Imprimez le bloc de données d'entrée.
Exemple
Le programme suivant utilise la fonction DataFrame() pour renvoyer une trame de données -
# importing pandas, numpy modules with alias names import pandas as pd import numpy as np # creating a dataframe inputDataframe = pd.DataFrame({'Name': ['Virat', 'Rohit', 'Meera', 'Nick', 'Sana'], 'Jobrole': ['Developer', 'Analyst', 'Help Desk', 'Database Developer', 'Finance accountant'], 'Age': [25, 30, 28, 25, 40]}) # displaying the dataframe print(inputDataframe)
Sortie
Une fois exécuté, le programme ci-dessus générera le résultat suivant -
Name Jobrole Age 0 Virat Developer 25 1 Rohit Analyst 30 2 Meera Help Desk 28 3 Nick Database Developer 25 4 Sana Finance accountant 40
Matrice en Python
Une matrice est une collection d'ensembles de données homogènes organisés dans une grille rectangulaire bidimensionnelle. Il s'agit d'un tableau m*n avec le même type de données. Il est créé avec une entrée vectorielle. Il existe un nombre fixe de lignes et de colonnes. Python prend en charge diverses opérations arithmétiques telles que l'addition, la soustraction, la multiplication et la division sur Matrix.
Application de la matrice
Il est très utile en économie pour calculer des statistiques telles que le PIB (produit intérieur brut) ou le PI (prix par habitant).
Il est également utile pour étudier les circuits électriques et électroniques.
Imprimez le bloc de données d'entrée.
Matrix est utilisé pour la recherche, comme dessiner des graphiques.
Ceci est utile en probabilités et en statistiques.
Multiplication de matrice en convertissant la matrice en bloc de données
Algorithme (étapes)
Voici les algorithmes/étapes à suivre pour effectuer la tâche requise -
Utilisez le mot-clé import pour importer le module pandas avec un alias.
Créez deux variables pour stocker respectivement les deux matrices d'entrée.
Créez des dataframes pour les première et deuxième matrices à l'aide de la fonction DataFrame() (Create DataFrame) du module pandas et stockez-les dans des variables séparées. Ces données sont chargées dans les Pandas DataFrames.
Imprimez le bloc de données de la matrice d'entrée 1.
Imprimez les dimensions (forme) de la matrice d'entrée 1 en appliquant l'attribut shape.
Imprimez la trame de données de la matrice d'entrée 2.
Imprimez les dimensions (forme) de la matrice d'entrée 2 en appliquant l'attribut shape.
Utilisez la fonction dot() pour multiplier les matrices inputMatrix_1 et inputMatrix_2 et créez une variable pour la stocker.
Imprimez la matrice résultat de la multiplication des matrices inputMatrix_1 et inputMatrix_2.
Imprimez les dimensions (forme) de la matrice résultante en appliquant l'attribut shape.
Exemple
Le programme suivant utilise la fonction DataFrame() pour renvoyer une trame de données -
# importing pandas module import pandas as pd # input matrix 1 inputMatrix_1 = [[1, 2, 2], [1, 2, 0], [1, 0, 2]] # input matrix 2 inputMatrix_2 = [[1, 0, 1], [2, 1, 1], [2, 1, 2]] # creating a dataframe of first matrix #(here data is loaded into a pandas DataFrames) df_1 = pd.DataFrame(data=inputMatrix_1) # creating a dataframe of second matrix df_2 = pd.DataFrame(data=inputMatrix_2) # printing the dataframe of input matrix 1 print("inputMatrix_1:") print(df_1) # printing the dimensions(shape) of input matrix 1 print("The dimensions(shape) of input matrix 1:") print(df_1.shape) print() # printing the dataframe of input matrix 2 print("inputMatrix_2:") print(df_2) # printing the dimensions(shape) of input matrix 1 print("The dimensions(shape) of input matrix 2:") print(df_2.shape) print() # multiplying both the matrices inputMatrix_1 and inputMatrix_2 result_mult = df_1.dot(df_2) # Printing the resultant of matrix multiplication of inputMatrix_1 and inputMatrix_2 print("Resultant Matrix after Matrix multiplication:") print(result_mult) # printing the dimensions(shape) of resultant Matrix print("The dimensions(shape) of Resultant Matrix:") print(result_mult.shape)
Sortie
inputMatrix_1: 0 1 2 0 1 2 2 1 1 2 0 2 1 0 2 The dimensions(shape) of input matrix 1: (3, 3) inputMatrix_2: 0 1 2 0 1 0 1 1 2 1 1 2 2 1 2 The dimensions(shape) of input matrix 2: (3, 3) Resultant Matrix after Matrix multiplication: 0 1 2 0 9 4 7 1 5 2 3 2 5 2 5 The dimensions(shape) of Resultant Matrix: (3, 3)
Vous trouverez ci-dessous le tableau des différences entre la matrice et le bloc de données.
Matrice et cadre de données
Matrice | Cadre de données |
---|---|
Il s'agit d'un ensemble d'ensembles de données disposés dans une organisation rectangulaire bidimensionnelle | Il stocke des tableaux de données avec plusieurs types de données dans plusieurs colonnes appelées champs. |
La matrice est un tableau m*n avec le même type de données | Une trame de données est une liste de vecteurs de même longueur. Une trame de données est une forme généralisée de matrice. |
Une matrice a un nombre fixe de lignes et de colonnes. | Le nombre de lignes et de colonnes de Dataframe est variable. |
Homogène | Hétérogène |
Conclusion
Nous avons découvert la différence entre la matrice et le bloc de données en Python dans cette application. Nous avons également appris à créer un bloc de données et à convertir une matrice en bloc de données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Article chaud

Outils chauds Tags

Article chaud

Tags d'article chaud

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Comment utiliser Python pour trouver la distribution ZIPF d'un fichier texte

Comment utiliser la belle soupe pour analyser HTML?

Comment effectuer l'apprentissage en profondeur avec TensorFlow ou Pytorch?

Introduction à la programmation parallèle et simultanée dans Python

Sérialisation et désérialisation des objets Python: partie 1

Comment implémenter votre propre structure de données dans Python

Modules mathématiques en python: statistiques
