Création de DataFrames à partir de dictionnaires avec des longueurs de tableau variables
Lors de la création d'un DataFrame à partir d'un dictionnaire où les valeurs sont des tableaux numpy, des erreurs ultérieures peuvent survenir si les tableaux n'ont pas la même longueur. En effet, Pandas nécessite des longueurs de tableau cohérentes pour chaque colonne.
Pour surmonter ce problème, Pandas autorise les valeurs manquantes (NaN) pour remplir les tableaux les plus courts. Cela permet la création de DataFrames avec des colonnes de longueurs différentes.
Python 2.x :
import pandas as pd import numpy as np d = dict( A = np.array([1,2]), B = np.array([1,2,3,4]) ) pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.iteritems() ]))
Python 3.x :
import pandas as pd import numpy as np d = dict( A = np.array([1,2]), B = np.array([1,2,3,4]) ) pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.items() ]))
Dans les deux cas, le DataFrame résultant aura les colonnes A et B, où A contient les deux premières valeurs du tableau respectif dans le dictionnaire et B contient les quatre valeurs. Le tableau le plus court (A) est complété par NaN pour les valeurs manquantes.
Sortie :
A B 0 1 1 1 2 2 2 NaN 3 3 NaN 4
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!