Menyiasat jenis data yang kompleks dalam Spark SQL
Pengenalan
Spark SQL menyokong data pertanyaan dengan jenis data yang kompleks, seperti peta dan tatasusunan. Dokumen ini menyediakan panduan untuk mengakses dan memanipulasi jenis kompleks ini dengan cekap.
Susun Pertanyaan
Akses elemen tatasusunan:
Pemetaan Pertanyaan
Nilai pemetaan akses:
Struktur pertanyaan
Medan struktur boleh diakses menggunakan sintaks titik:
df.select($"struct_name.field_name")
SELECT struct_name.field_name FROM df
Susun atur struktur
Medan dalam tatasusunan struktur boleh diakses menggunakan kaedah berikut:
getItem
dan getField
. Jenis Ditentukan Pengguna (UDT)
Gunakan UDF untuk mengakses medan UDT. Untuk maklumat lanjut, lihat dokumentasi Spark SQL.
Nota Prestasi
Fungsi tambahan
Spark SQL menyokong pelbagai fungsi terbina dalam untuk jenis kompleks:
array_max
, array_sum
, arrays_zip
, array_union
map_keys
, map_values
Atas ialah kandungan terperinci Bagaimanakah Saya Menyoal Jenis Data Kompleks (Array, Peta, Struktur, UDT) dalam Spark SQL?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!