Menukar Pandas DataFrame yang mengandungi nilai yang hilang kepada tatasusunan NumPy ialah tugas biasa dalam analisis data. Output yang diingini ialah np.nan mewakili nilai yang tiada.
Kaedah yang disyorkan untuk penukaran ini ialah menggunakan kaedah df.to_numpy():
<code class="python">import numpy as np import pandas as pd # Create a DataFrame with missing values index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan] df = pd.DataFrame({'A': a, 'B': b, 'C': c}, index=index) # Convert to NumPy array np_array = df.to_numpy() print(np_array)</code>
Ini akan mengeluarkan:
<code class="python">array([[ nan, 0.2, nan], [ nan, nan, 0.5], [ nan, 0.2, 0.5], [ 0.1, 0.2, nan], [ 0.1, 0.2, 0.5], [ 0.1, nan, 0.5], [ 0.1, nan, nan]])</code>
Untuk mengekalkan jenis data dalam tatasusunan NumPy output, anda boleh menggunakan kaedah df.to_records() :
<code class="python">records = df.to_records() print(records.dtype)</code>
Ini akan mengeluarkan:
<code class="python">[('index', 'O'), ('A', '<f8'), ('B', '<f8'), ('C', '<f8')]</code>
di mana O mewakili jenis objek (indeks), dan f8 mewakili jenis float64 (nilai).
Menggunakan np .rec.fromrecords, anda boleh menukar rekod kepada tatasusunan NumPy berstruktur:
<code class="python">import numpy as np np_array = np.rec.fromrecords(records, names=df.columns) print(np_array.dtype)</code>
Ini akan mengeluarkan jenis data yang sama seperti rekod.
Atas ialah kandungan terperinci Bagaimana untuk Menukar Pandas DataFrame dengan Nilai Hilang kepada NumPy Array?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!