누락된 값이 포함된 Pandas DataFrame을 NumPy 배열로 변환하는 것은 데이터 분석에서 일반적인 작업입니다. 원하는 출력은 np.nan이 누락된 값을 나타내도록 하는 것입니다.
이 변환에 권장되는 방법은 df.to_numpy() 메서드를 사용하는 것입니다.
<code class="python">import numpy as np import pandas as pd # Create a DataFrame with missing values index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan] df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index) # Convert to NumPy array np_array = df.to_numpy() print(np_array)</code>
이 결과는 다음과 같습니다.
<code class="python">array([[ nan, 0.2, nan], [ nan, nan, 0.5], [ nan, 0.2, 0.5], [ 0.1, 0.2, nan], [ 0.1, 0.2, 0.5], [ 0.1, nan, 0.5], [ 0.1, nan, nan]])</code>
출력 NumPy 배열의 데이터 유형을 보존하려면 df.to_records() 메서드를 사용할 수 있습니다.
<code class="python">records = df.to_records() print(records.dtype)</code>
이 결과는 다음과 같습니다.
<code class="python">[('index', 'O'), ('A', '<f8'), ('B', '<f8'), ('C', '<f8')]</code>
여기서 O는 객체 유형(인덱스)을 나타내고 f8은 float64 유형(인덱스)을 나타냅니다. 값).
np.rec.fromrecords를 사용하면 레코드를 구조화된 NumPy 배열로 변환할 수 있습니다.
<code class="python">import numpy as np np_array = np.rec.fromrecords(records, names=df.columns) print(np_array.dtype)</code>
이렇게 하면 레코드와 동일한 데이터 유형이 출력됩니다.
위 내용은 누락된 값이 있는 Pandas DataFrame을 NumPy 배열로 변환하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!