配列長が異なるディクショナリからの DataFrame の作成
値が numpy 配列であるディクショナリから DataFrame を作成すると、後続のエラーが発生する可能性があります配列の長さが同じでない場合。これは、Pandas では各列に一貫した配列長が必要であるためです。
これを克服するために、Pandas では欠損値 (NaN) を使用して短い配列を埋めることができます。これにより、異なる長さの列を持つ DataFrame を作成できます。
Python 2.x:
import pandas as pd import numpy as np d = dict( A = np.array([1,2]), B = np.array([1,2,3,4]) ) pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.iteritems() ]))
Python 3.x:
import pandas as pd import numpy as np d = dict( A = np.array([1,2]), B = np.array([1,2,3,4]) ) pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in d.items() ]))
どちらの場合も、結果の DataFrame には列 A と B が含まれます。A にはディクショナリ内のそれぞれの配列の最初の 2 つの値が含まれ、B には 4 つの値すべてが含まれます。短い配列 (A) には欠損値の NaN が埋め込まれます。
出力:
A B 0 1 1 1 2 2 2 NaN 3 3 NaN 4
以上がさまざまな配列長の辞書から Pandas DataFrame を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。