PostgreSQL SELECT DISTINCT
Bottleneck Prestasi: Kajian Kes
Artikel ini mengkaji isu prestasi yang dihadapi dengan pertanyaan SELECT DISTINCT
pada jadual PostgreSQL yang mengandungi kira-kira dua juta rekod.
Konteks
Jadual tickers
menyimpan data daripada saluran "ticker" Coinbase Pro. Kunci utama komposit termasuk lajur product_id
.
Masalah Prestasi
Pertanyaan SELECT DISTINCT product_id FROM tickers
dijangka berprestasi baik kerana indeks pada product_id
. Walau bagaimanapun, pelaksanaan secara konsisten mengambil masa 500-600 milisaat.
Penyiasatan Rancangan Pertanyaan
EXPLAIN ANALYZE
menunjukkan perancang pertanyaan lalai kepada imbasan berjujukan, mengabaikan indeks product_id
. Memaksa penggunaan indeks tidak menyelesaikan masalah prestasi.
Percubaan Pengoptimuman Indeks
Mencipta indeks khusus pada product_id
hanya menghasilkan peningkatan kecil, dengan imbasan berurutan masih diutamakan oleh perancang melainkan ditolak secara eksplisit.
Penyelesaian Berkesan: Indeks Skip Scan Emulasi
Penyelesaian yang dilaksanakan mencontohi imbasan langkau indeks menggunakan pertanyaan rekursif dengan cantuman sisi. Pendekatan ini meningkatkan prestasi dengan ketara, mengurangkan masa pelaksanaan kepada 0.75 milisaat walaupun dengan set data sebanyak 2.25 juta baris.
Ringkasan
Keupayaan imbasan langkau indeks asli PostgreSQL semasa diatasi dengan teknik emulasi ini. Kaedah ini menggunakan indeks sedia ada dengan berkesan dan mengelakkan penalti prestasi imbasan berurutan untuk pertanyaan SELECT DISTINCT
pada jadual besar.
Atas ialah kandungan terperinci Mengapa PostgreSQL Saya `SELECT DISTINCT` Begitu Lambat, dan Bagaimana Saya Boleh Membetulkannya?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!