누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하는 방법은 무엇입니까?-파이썬 튜토리얼-php.cn

누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하는 방법은 무엇입니까?

Linda Hamilton

풀어 주다： 2024-11-04 12:17:29

원래의

662명이 탐색했습니다.

How to Convert a Pandas DataFrame with Missing Values to a NumPy Array?

누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환

누락된 값이 포함된 Pandas DataFrame을 NumPy 배열로 변환하는 것은 데이터 분석에서 일반적인 작업입니다. 원하는 출력은 np.nan이 누락된 값을 나타내도록 하는 것입니다.

df.to_numpy() 사용

이 변환에 권장되는 방법은 df.to_numpy() 메서드를 사용하는 것입니다.

<code class="python">import numpy as np
import pandas as pd

# Create a DataFrame with missing values
index = [1, 2, 3, 4, 5, 6, 7]
a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1]
b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan]
c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan]
df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index)

# Convert to NumPy array
np_array = df.to_numpy()
print(np_array)</code>

로그인 후 복사

이 결과는 다음과 같습니다.

<code class="python">array([[ nan,  0.2,  nan],
       [ nan,  nan,  0.5],
       [ nan,  0.2,  0.5],
       [ 0.1,  0.2,  nan],
       [ 0.1,  0.2,  0.5],
       [ 0.1,  nan,  0.5],
       [ 0.1,  nan,  nan]])</code>

로그인 후 복사

데이터 보존 중 유형

출력 NumPy 배열의 데이터 유형을 보존하려면 df.to_records() 메서드를 사용할 수 있습니다.

<code class="python">records = df.to_records()
print(records.dtype)</code>

로그인 후 복사

이 결과는 다음과 같습니다.

<code class="python">[('index', 'O'), ('A', '<f8'), ('B', '<f8'), ('C', '<f8')]</code>

로그인 후 복사

여기서 O는 객체 유형(인덱스)을 나타내고 f8은 float64 유형(인덱스)을 나타냅니다. 값).

np.rec.fromrecords를 사용하면 레코드를 구조화된 NumPy 배열로 변환할 수 있습니다.

<code class="python">import numpy as np

np_array = np.rec.fromrecords(records, names=df.columns)
print(np_array.dtype)</code>

로그인 후 복사

이렇게 하면 레코드와 동일한 데이터 유형이 출력됩니다.

위 내용은 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!