ホームページ > バックエンド開発 > Python チュートリアル > NaN 値を含む Pandas 列を整数データ型に変換するにはどうすればよいですか?

NaN 値を含む Pandas 列を整数データ型に変換するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-11-28 18:57:19
オリジナル
761 人が閲覧しました

How to Convert Pandas Columns with NaN Values to Integer Data Type?

NaN 値を含む Pandas 列を Dtype 'int' に変換する

Pandas ライブラリを使用して Python でデータ操作を行う場合、次のことが一般的です。欠損値または NaN 値を持つ列が発生する場合があります。 NaN 値は整数演算と互換性がないため、このような列を整数データ型 ('int') に変換すると、特有の課題が生じます。

この問題を克服するために、Pandas はバージョン 0.24 で新しい null 許容整数データ型を導入しました。 。このデータ型では、欠損値の可能性がある整数値の表現が可能です。

列の dtype を 'int64' として明示的に指定するには、'astypte' メソッドを利用できます。ただし、「astype」メソッドでは NaN 値を整数に直接変換できないことを覚えておくことが重要です。

NaN 値を含む列を null 許容整数データ型に変換するには、次の手順に従います。

  1. 「import pandas as pd」を使用して「pandas」から「array」モジュールをインポートしますstate.
  2. 適切な dtype を持つ配列関数を使用して列を初期化します。例:

    'arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype())'
    
    ログイン後にコピー
  3. 新しく作成した配列を Pandas シリーズに割り当てます。

    ' pd.Series(arr)'
    
    ログイン後にコピー
  4. DataFrame 内の列を変換するにはnull 許容の整数データ型に変換するには、「astype」を使用します。

    'df['myCol'] = df['myCol'].astype('Int64')'
    
    ログイン後にコピー
  5. 欠損値を 0 に置き換えたり、中央値/最頻値を計算したりするなど、必要に応じて欠損値を処理します。

以上がNaN 値を含む Pandas 列を整数データ型に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート