누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하는 방법은 무엇입니까?

Linda Hamilton
풀어 주다: 2024-11-04 12:17:29
원래의
496명이 탐색했습니다.

How to Convert a Pandas DataFrame with Missing Values to a NumPy Array?

누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환

누락된 값이 포함된 Pandas DataFrame을 NumPy 배열로 변환하는 것은 데이터 분석에서 일반적인 작업입니다. 원하는 출력은 np.nan이 누락된 값을 나타내도록 하는 것입니다.

df.to_numpy() 사용

이 변환에 권장되는 방법은 df.to_numpy() 메서드를 사용하는 것입니다.

<code class="python">import numpy as np
import pandas as pd

# Create a DataFrame with missing values
index = [1, 2, 3, 4, 5, 6, 7]
a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1]
b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan]
c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan]
df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index)

# Convert to NumPy array
np_array = df.to_numpy()
print(np_array)</code>
로그인 후 복사

이 결과는 다음과 같습니다.

<code class="python">array([[ nan,  0.2,  nan],
       [ nan,  nan,  0.5],
       [ nan,  0.2,  0.5],
       [ 0.1,  0.2,  nan],
       [ 0.1,  0.2,  0.5],
       [ 0.1,  nan,  0.5],
       [ 0.1,  nan,  nan]])</code>
로그인 후 복사

데이터 보존 중 유형

출력 NumPy 배열의 데이터 유형을 보존하려면 df.to_records() 메서드를 사용할 수 있습니다.

<code class="python">records = df.to_records()
print(records.dtype)</code>
로그인 후 복사

이 결과는 다음과 같습니다.

<code class="python">[('index', 'O'), ('A', '<f8'), ('B', '<f8'), ('C', '<f8')]</code>
로그인 후 복사

여기서 O는 객체 유형(인덱스)을 나타내고 f8은 float64 유형(인덱스)을 나타냅니다. 값).

np.rec.fromrecords를 사용하면 레코드를 구조화된 NumPy 배열로 변환할 수 있습니다.

<code class="python">import numpy as np

np_array = np.rec.fromrecords(records, names=df.columns)
print(np_array.dtype)</code>
로그인 후 복사

이렇게 하면 레코드와 동일한 데이터 유형이 출력됩니다.

위 내용은 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!