PostgreSQL SELECT DISTINCT
Strategi Bottleneck dan Pengoptimuman Prestasi
Pertanyaan SELECT DISTINCT
pada jadual PostgreSQL yang mengandungi hampir dua juta rekod mempamerkan prestasi perlahan yang tidak dijangka (500-600ms). Perancang pertanyaan secara tidak dapat dijelaskan secara lalai kepada imbasan berjujukan dan bukannya memanfaatkan indeks yang tersedia, malah pemaksaan indeks tidak meningkatkan masa pelaksanaan dengan ketara.
Meniru Imbasan Langkau Indeks dalam PostgreSQL
Oleh kerana PostgreSQL tidak mempunyai fungsi imbasan langkau indeks asli, penyelesaian menggunakan ungkapan jadual biasa (CTE) rekursif boleh meniru gelagatnya. CTE ini secara berulang mendapatkan ID produk yang berbeza dalam tertib menaik, menggunakan indeks pada product_id
untuk kecekapan:
<code class="language-sql">WITH RECURSIVE cte AS ( ( SELECT product_id FROM tickers ORDER BY 1 LIMIT 1 ) UNION ALL SELECT l.* FROM cte c CROSS JOIN LATERAL ( SELECT product_id FROM tickers t WHERE t.product_id > c.product_id ORDER BY 1 LIMIT 1 ) l ) SELECT * FROM cte;</code>
Pendekatan ini menawarkan peningkatan prestasi yang besar berbanding dengan imbasan jadual penuh.
Pendekatan Alternatif: DISTINCT
dan DISTINCT ON
Untuk jadual dengan pengedaran baris yang lebih sekata bagi setiap ID produk unik, kata kunci standard DISTINCT
atau DISTINCT ON
mungkin terbukti lebih cepat daripada imbasan langkau indeks yang dicontohi. Prestasi mereka sangat bergantung pada pengedaran data.
Penambahbaikan Masa Depan: Imbasan Langkau Indeks Asli
Pembangunan PostgreSQL termasuk kerja berterusan untuk menyepadukan keupayaan imbasan langkau indeks asli. Peningkatan masa hadapan ini menjanjikan pengoptimuman prestasi selanjutnya untuk SELECT DISTINCT
pertanyaan.
Atas ialah kandungan terperinci Mengapa pertanyaan PostgreSQL SELECT DISTINCT saya sangat perlahan, dan bagaimana saya boleh meningkatkan prestasinya?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!