Pengumpulan Tatasusunan Cekap dengan NumPy
Walaupun NumPy mungkin tidak menawarkan fungsi luar kotak yang direka khusus untuk menyusun tatasusunan, terdapat adalah teknik serba boleh yang boleh mencapai hasil yang serupa dengan berkesan.
Diilhamkan oleh Perpustakaan Eelco
Satu pendekatan diilhamkan oleh perpustakaan Eelco Hoogendoorn, memudahkannya dengan mengeksploitasi andaian bahawa lajur pertama tatasusunan input meningkat secara monoton. Jika tidak, ia boleh diisih dahulu menggunakan a = a[a[:, 0].argsort()].
np.split(a[:, 1], np.unique(a[:, 0], return_index=True)[1][1:])
Kumpulan Mengenalpasti Unik
Ini coretan memanfaatkan np.unique() untuk mengenal pasti nilai unik dalam lajur pertama, mengembalikan indeksnya. Indeks ini digunakan untuk membahagikan lajur kedua kepada subbarray berasingan yang mewakili setiap kumpulan.
Kerumitan Masa dan Prestasi
Kaedah ini menunjukkan kerumitan O(n), menjadikannya sangat cekap. Pengukuran masa empirikal pada tatasusunan dengan saiz kumpulan berbeza mengesahkan kelebihan prestasinya berbanding pendekatan lain seperti panda, diindeks numpy dan lalai.
Penyelesaian Alternatif
Melangkaui pendekatan yang dibentangkan , teknik berasaskan NumPy seperti numpy_groupies juga boleh diterokai untuk pengelompokan operasi.
Pertimbangan Tambahan
Jika lajur pertama tatasusunan input tidak diisih, adalah disyorkan untuk mengisihnya sebelum mengumpulkan untuk memastikan hasil yang tepat. Perlu diingat bahawa algoritma pengisihan tertentu, seperti argsort, mempunyai kerumitan masa O(n log(n)).
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengumpul Tatasusunan NumPy dengan Cekap?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!