Rumah hujung hadapan web tutorial js Kedudukan Carian Teks Penuh PostgreSQL mengikut Kedudukan

Kedudukan Carian Teks Penuh PostgreSQL mengikut Kedudukan

Dec 13, 2024 pm 01:08 PM

PostgreSQL Full Text Search Rank by Position

Baru-baru ini, saya menghadapi masalah dengan carian teks penuh. Saya menggunakan ciri ini dalam input carian saya, di mana bahagian belakang menghantar petunjuk kemungkinan padanan semasa anda menaip. Pangkalan data bahagian belakang ialah PostgreSQL. Saya memerlukan pembayang untuk disenaraikan mengikut kedudukan istilah yang dicari dalam teks.

Jadi, jika anda mencari tajuk "Star Wars", anda akan mendapat siaran "Star Wars" terlebih dahulu dan bukannya "Bagaimana Star Wars 7- 9 mengubah dunia Star Wars (dokumentari yang menyeronokkan tentang Star Wars)" yang mungkin mempunyai kedudukan yang lebih tinggi kerana istilah itu ada 3 kali ganda.

Carian Teks Penuh dalam PostgreSQL

Carian teks penuh dalam PostgreSQL boleh dicapai dengan mudah. Terdapat dua alatan utama untuk digunakan:

  • tsvector - mewakili dokumen yang boleh dicari.
  • tsquery - mewakili pertanyaan carian untuk dilakukan terhadap dokumen.

Katakan kita mahu mencari tajuk catatan blog kita. Untuk menjadikannya boleh dicari, kita boleh menggunakan pertanyaan berikut:

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);
Salin selepas log masuk
Salin selepas log masuk

Dalam kes ini, kami menukar tajuk siaran kepada tsvector secara dinamik dengan setiap carian. Walau bagaimanapun, transformasi ini mengambil sedikit masa. Pendekatan yang lebih baik ialah melakukan transformasi ini terlebih dahulu dalam pangkalan data dan juga menyimpannya sebagai indeks untuk tajuk untuk carian yang lebih pantas.

Mari buat lajur baharu bagi vektor tajuk dan juga indeks lajur baharu ini:

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);
Salin selepas log masuk
Salin selepas log masuk

Sekarang cuba cari istilah "JavaScript"

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;
Salin selepas log masuk
Salin selepas log masuk

Anda juga boleh membuat indeks daripada vektor ts terus pada lajur tajuk seperti ini:

CREATE INDEX titles_fts_idx ON blogposts USING GIN (to_tsvector(posts.title));
Salin selepas log masuk

dan gunakan carian seperti ini:

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ posts.title;
Salin selepas log masuk

Kini, carian teks penuh akan menjadi sangat pantas, selesai dalam milisaat.

Kedudukan Keputusan

PostgreSQL menyediakan ciri ts_rank, yang membolehkan anda menjaringkan hasil carian dan menyusunnya berdasarkan kedudukan mereka. PostgreSQL menyokong pilihan kedudukan berikut:

  • 0 (lalai) mengabaikan panjang dokumen
  • 1 membahagikan pangkat dengan 1 logaritma panjang dokumen
  • 2 membahagikan pangkat dengan panjang dokumen
  • 4 membahagikan pangkat dengan jarak harmonik min antara takat (ini hanya dilaksanakan oleh ts_rank_cd)
  • 8 membahagikan pangkat dengan bilangan perkataan unik dalam dokumen
  • 16 membahagikan pangkat dengan 1 logaritma bilangan perkataan unik dalam dokumen
  • 32 membahagikan pangkat dengan sendirinya 1

Anda boleh menggunakan ts_rank seperti ini:

SELECT
    ...
ts_rank(search_vector, to_tsquery('JavaScript'), 0) as rank_title
    ...
ORDER BY rank_title DESC NULLS LAST
Salin selepas log masuk

Walau bagaimanapun, tiada pilihan kedudukan terbina dalam berdasarkan kedudukan istilah carian dalam rentetan (iaitu lajur tajuk).

KEDUDUKAN untuk menyelamatkan

Nasib baik ada fungsi POSITION dalam PostgreSQL. Fungsi PostgreSQL POSITION digunakan untuk mencari lokasi subrentetan dalam rentetan tertentu. Dalam kes kami, kami boleh menggunakannya seperti ini

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);
Salin selepas log masuk
Salin selepas log masuk

ts_rank menggunakan integer normalisasi 2 kerana 2 membahagikan pangkat dengan panjang dokumen
Nombor sihir 0.0001 adalah untuk mengelakkan pembahagian dengan 0 kerana fungsi POSTION dikira daripada 1 bukan 0 dan mengembalikan 0 jika rentetan tidak ditemui.

Kod akhir mungkin kelihatan seperti ini:

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);
Salin selepas log masuk
Salin selepas log masuk

Mencari lebih banyak istilah

Satu kaveat perlu disebut jika anda mencari lebih banyak istilah sekali gus (seperti JavaScript dan TypeScript).

Argumen untuk fungsi to_tsquery boleh digunakan dengan kefleksibelan yang besar, termasuk pengendali logik dll. Fungsi POSITION sebaliknya ialah "hanya" subrentetan dalam rentetan.

Contoh Dunia Nyata

Berikut ialah contoh saya dari titik akhir dunia sebenar dalam aplikasi web SvelteKit yang menggunakan perpustakaan npm postgres (sql):

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;
Salin selepas log masuk
Salin selepas log masuk

Berikut ialah pautan kepada dokumentasi dalam perkara:

  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-QUERIES https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-DOCUMENTS
  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-RANKING
  • https://www.postgresql.org/docs/9.1/functions-string.html

Atas ialah kandungan terperinci Kedudukan Carian Teks Penuh PostgreSQL mengikut Kedudukan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apa yang perlu saya lakukan jika saya menghadapi percetakan kod yang dihiasi untuk resit kertas terma depan? Apa yang perlu saya lakukan jika saya menghadapi percetakan kod yang dihiasi untuk resit kertas terma depan? Apr 04, 2025 pm 02:42 PM

Soalan dan penyelesaian yang sering ditanya untuk percetakan tiket kertas terma depan dalam pembangunan front-end, percetakan tiket adalah keperluan umum. Walau bagaimanapun, banyak pemaju sedang melaksanakan ...

Demystifying JavaScript: Apa yang berlaku dan mengapa penting Demystifying JavaScript: Apa yang berlaku dan mengapa penting Apr 09, 2025 am 12:07 AM

JavaScript adalah asas kepada pembangunan web moden, dan fungsi utamanya termasuk pengaturcaraan yang didorong oleh peristiwa, penjanaan kandungan dinamik dan pengaturcaraan tak segerak. 1) Pengaturcaraan yang didorong oleh peristiwa membolehkan laman web berubah secara dinamik mengikut operasi pengguna. 2) Penjanaan kandungan dinamik membolehkan kandungan halaman diselaraskan mengikut syarat. 3) Pengaturcaraan Asynchronous memastikan bahawa antara muka pengguna tidak disekat. JavaScript digunakan secara meluas dalam interaksi web, aplikasi satu halaman dan pembangunan sisi pelayan, sangat meningkatkan fleksibiliti pengalaman pengguna dan pembangunan silang platform.

Siapa yang dibayar lebih banyak Python atau JavaScript? Siapa yang dibayar lebih banyak Python atau JavaScript? Apr 04, 2025 am 12:09 AM

Tidak ada gaji mutlak untuk pemaju Python dan JavaScript, bergantung kepada kemahiran dan keperluan industri. 1. Python boleh dibayar lebih banyak dalam sains data dan pembelajaran mesin. 2. JavaScript mempunyai permintaan yang besar dalam perkembangan depan dan stack penuh, dan gajinya juga cukup besar. 3. Faktor mempengaruhi termasuk pengalaman, lokasi geografi, saiz syarikat dan kemahiran khusus.

Bagaimana untuk menggabungkan elemen array dengan ID yang sama ke dalam satu objek menggunakan JavaScript? Bagaimana untuk menggabungkan elemen array dengan ID yang sama ke dalam satu objek menggunakan JavaScript? Apr 04, 2025 pm 05:09 PM

Bagaimana cara menggabungkan elemen array dengan ID yang sama ke dalam satu objek dalam JavaScript? Semasa memproses data, kita sering menghadapi keperluan untuk mempunyai id yang sama ...

Adakah JavaScript sukar belajar? Adakah JavaScript sukar belajar? Apr 03, 2025 am 12:20 AM

Pembelajaran JavaScript tidak sukar, tetapi ia mencabar. 1) Memahami konsep asas seperti pembolehubah, jenis data, fungsi, dan sebagainya. 2) Pengaturcaraan asynchronous tuan dan melaksanakannya melalui gelung acara. 3) Gunakan operasi DOM dan berjanji untuk mengendalikan permintaan tak segerak. 4) Elakkan kesilapan biasa dan gunakan teknik debugging. 5) Mengoptimumkan prestasi dan mengikuti amalan terbaik.

Bagaimana untuk mencapai kesan menatal paralaks dan kesan animasi elemen, seperti laman web rasmi Shiseido?
atau:
Bagaimanakah kita dapat mencapai kesan animasi yang disertai dengan menatal halaman seperti laman web rasmi Shiseido? Bagaimana untuk mencapai kesan menatal paralaks dan kesan animasi elemen, seperti laman web rasmi Shiseido? atau: Bagaimanakah kita dapat mencapai kesan animasi yang disertai dengan menatal halaman seperti laman web rasmi Shiseido? Apr 04, 2025 pm 05:36 PM

Perbincangan mengenai realisasi kesan animasi tatal dan elemen Parallax dalam artikel ini akan meneroka bagaimana untuk mencapai yang serupa dengan laman web rasmi Shiseido (https://www.shiseido.co.jp/sb/wonderland/) ... ...

Evolusi JavaScript: Trend Semasa dan Prospek Masa Depan Evolusi JavaScript: Trend Semasa dan Prospek Masa Depan Apr 10, 2025 am 09:33 AM

Trend terkini dalam JavaScript termasuk kebangkitan TypeScript, populariti kerangka dan perpustakaan moden, dan penerapan webassembly. Prospek masa depan meliputi sistem jenis yang lebih berkuasa, pembangunan JavaScript, pengembangan kecerdasan buatan dan pembelajaran mesin, dan potensi pengkomputeran IoT dan kelebihan.

Perbezaan dalam Konsol.Log Output Result: Mengapa kedua -dua panggilan berbeza? Perbezaan dalam Konsol.Log Output Result: Mengapa kedua -dua panggilan berbeza? Apr 04, 2025 pm 05:12 PM

Perbincangan mendalam mengenai punca-punca utama perbezaan dalam output konsol.log. Artikel ini akan menganalisis perbezaan hasil output fungsi Console.log dalam sekeping kod dan menerangkan sebab -sebab di belakangnya. � ...

See all articles