웹 프론트엔드 JS 튜토리얼 PostgreSQL 전체 텍스트 검색 위치별 순위

PostgreSQL 전체 텍스트 검색 위치별 순위

Dec 13, 2024 pm 01:08 PM

PostgreSQL Full Text Search Rank by Position

최근 전체 텍스트 검색에 문제가 발생했습니다. 저는 검색 입력에 이 기능을 사용하고 있습니다. 여기서 백엔드는 사용자가 입력할 때 가능한 일치 항목에 대한 힌트를 보냅니다. 백엔드 데이터베이스는 PostgreSQL입니다. 본문 내 검색어의 위치에 따라 순위를 매길 수 있는 힌트가 필요했습니다.

따라서 "스타워즈" 제목을 검색하면 "스타워즈 7-9가 어떻게 스타워즈의 세계를 바꾸었나(스타워즈에 대해 재미있게 만든 다큐멘터리)" 대신 "스타워즈" 게시물이 먼저 표시됩니다. 용어가 3번 나올수록 순위가 높습니다.

PostgreSQL의 전체 텍스트 검색

PostgreSQL에서는 전체 텍스트 검색을 매우 쉽게 수행할 수 있습니다. 사용할 수 있는 두 가지 주요 도구는 다음과 같습니다.

  • tsVector - 검색 가능한 문서를 나타냅니다.
  • tsquery - 문서에 대해 수행할 검색어를 나타냅니다.

블로그 게시물의 제목을 검색하고 싶다고 가정해 보겠습니다. 검색 가능하게 하려면 다음 쿼리를 사용하면 됩니다.

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);
로그인 후 복사
로그인 후 복사

이 경우 검색할 때마다 게시물 제목을 ts벡터로 동적으로 변환합니다. 그러나 이 변환에는 시간이 좀 걸립니다. 더 나은 접근 방식은 이러한 변환을 데이터베이스에서 미리 수행하고 더 빠른 검색을 위해 제목에 대한 인덱스로 저장하는 것입니다.

제목 벡터의 새 열을 만들고 이 새 열의 색인을 생성해 보겠습니다.

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);
로그인 후 복사
로그인 후 복사

이제 "JavaScript"를 검색해 보세요

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;
로그인 후 복사
로그인 후 복사

다음과 같이 제목 열에서 직접 ts 벡터의 색인을 만들 수도 있습니다.

CREATE INDEX titles_fts_idx ON blogposts USING GIN (to_tsvector(posts.title));
로그인 후 복사

다음과 같이 검색을 사용하세요.

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ posts.title;
로그인 후 복사

이제 전체 텍스트 검색이 엄청나게 빨라져 밀리초 안에 완료됩니다.

결과 순위 지정

PostgreSQL은 검색 결과의 점수를 매기고 순위에 따라 정렬할 수 있는 ts_rank 기능을 제공합니다. PostgreSQL은 다음 순위 옵션을 지원합니다.

  • 0(기본값)은 문서 길이를 무시합니다
  • 1은 순위를 문서 길이의 로그 1로 나눕니다
  • 2 순위를 문서 길이로 나눕니다
  • 4는 순위를 익스텐트 간 평균 조화 거리로 나눕니다(이는 ts_rank_cd로만 구현됨)
  • 8은 문서 내 고유 단어 수로 순위를 나눕니다
  • 16은 순위를 문서의 고유 단어 수에 대한 로그 1로 나눕니다
  • 32는 순위를 1로 나눕니다

ts_rank를 다음과 같이 사용할 수 있습니다.

SELECT
    ...
ts_rank(search_vector, to_tsquery('JavaScript'), 0) as rank_title
    ...
ORDER BY rank_title DESC NULLS LAST
로그인 후 복사

단, 문자열(예: 제목 열) 내 검색어 위치를 기준으로 하는 순위 옵션이 내장되어 있지 않습니다.

구조를 위한 POSITION

다행히 PostgreSQL에는 POSITION 함수가 있습니다. PostgreSQL POSITION 함수는 주어진 문자열 내에서 하위 문자열의 위치를 ​​찾는 데 사용됩니다. 우리의 경우에는 이렇게 사용할 수 있습니다

SELECT 
id, 
title 
FROM blogposts
WHERE to_tsquery('JavaScript') @@ to_tsvector(posts.title);
로그인 후 복사
로그인 후 복사

ts_rank는 2가 순위를 문서 길이로 나누기 때문에 정규화 정수 2를 사용합니다.
Magick 번호 0.0001은 POSTION 함수가 0이 아닌 1부터 계산하고 문자열이 없으면 0을 반환하기 때문에 0으로 나누는 것을 방지하기 위한 것입니다.

최종 코드는 다음과 같습니다.

ALTER TABLE blogposts ADD COLUMN search_vector tsvector;
UPDATE blogposts SET search_vector = (to_tsvector(posts.title));
CREATE INDEX titles_fts_idx ON blogposts USING gin(search_vector);
로그인 후 복사
로그인 후 복사

더 많은 용어 검색 중

한 번에 더 많은 용어를 검색하는 경우 한 가지 주의 사항을 언급해야 합니다(예: JavaScriptTypeScript).

to_tsquery 함수의 인수는 논리 연산자 등을 포함하여 매우 유연하게 사용될 수 있습니다. 반면에 POSITION 함수는 문자열의 하위 문자열 "단지"입니다.

실제 사례

다음은 postgres(sql) npm 라이브러리를 사용하는 SvelteKit 웹 애플리케이션의 실제 엔드포인트 예입니다.

SELECT 
id, 
title
FROM blogposts
WHERE to_tsquery('JavaScript') @@ search_vector;
로그인 후 복사
로그인 후 복사

다음은 해당 문제의 문서에 대한 링크입니다:

  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-QUERIES https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-PARSING-DOCUMENTS
  • https://www.postgresql.org/docs/current/textsearch-controls.html#TEXTSEARCH-RANKING
  • https://www.postgresql.org/docs/9.1/functions-string.html

위 내용은 PostgreSQL 전체 텍스트 검색 위치별 순위의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

프론트 엔드 열 용지 영수증에 대한 차량 코드 인쇄를 만나면 어떻게해야합니까? 프론트 엔드 열 용지 영수증에 대한 차량 코드 인쇄를 만나면 어떻게해야합니까? Apr 04, 2025 pm 02:42 PM

프론트 엔드 개발시 프론트 엔드 열지대 티켓 인쇄를위한 자주 묻는 질문과 솔루션, 티켓 인쇄는 일반적인 요구 사항입니다. 그러나 많은 개발자들이 구현하고 있습니다 ...

Demystifying JavaScript : 그것이하는 일과 중요한 이유 Demystifying JavaScript : 그것이하는 일과 중요한 이유 Apr 09, 2025 am 12:07 AM

JavaScript는 현대 웹 개발의 초석이며 주요 기능에는 이벤트 중심 프로그래밍, 동적 컨텐츠 생성 및 비동기 프로그래밍이 포함됩니다. 1) 이벤트 중심 프로그래밍을 사용하면 사용자 작업에 따라 웹 페이지가 동적으로 변경 될 수 있습니다. 2) 동적 컨텐츠 생성을 사용하면 조건에 따라 페이지 컨텐츠를 조정할 수 있습니다. 3) 비동기 프로그래밍은 사용자 인터페이스가 차단되지 않도록합니다. JavaScript는 웹 상호 작용, 단일 페이지 응용 프로그램 및 서버 측 개발에 널리 사용되며 사용자 경험 및 크로스 플랫폼 개발의 유연성을 크게 향상시킵니다.

누가 더 많은 파이썬이나 자바 스크립트를 지불합니까? 누가 더 많은 파이썬이나 자바 스크립트를 지불합니까? Apr 04, 2025 am 12:09 AM

기술 및 산업 요구에 따라 Python 및 JavaScript 개발자에 대한 절대 급여는 없습니다. 1. 파이썬은 데이터 과학 및 기계 학습에서 더 많은 비용을 지불 할 수 있습니다. 2. JavaScript는 프론트 엔드 및 풀 스택 개발에 큰 수요가 있으며 급여도 상당합니다. 3. 영향 요인에는 경험, 지리적 위치, 회사 규모 및 특정 기술이 포함됩니다.

JavaScript는 배우기가 어렵습니까? JavaScript는 배우기가 어렵습니까? Apr 03, 2025 am 12:20 AM

JavaScript를 배우는 것은 어렵지 않지만 어려운 일입니다. 1) 변수, 데이터 유형, 기능 등과 같은 기본 개념을 이해합니다. 2) 마스터 비동기 프로그래밍 및 이벤트 루프를 통해이를 구현하십시오. 3) DOM 운영을 사용하고 비동기 요청을 처리합니다. 4) 일반적인 실수를 피하고 디버깅 기술을 사용하십시오. 5) 성능을 최적화하고 모범 사례를 따르십시오.

Shiseido의 공식 웹 사이트와 같은 시차 스크롤 및 요소 애니메이션 효과를 달성하는 방법은 무엇입니까?
또는:
Shiseido의 공식 웹 사이트와 같은 페이지 스크롤과 함께 애니메이션 효과를 어떻게 달성 할 수 있습니까? Shiseido의 공식 웹 사이트와 같은 시차 스크롤 및 요소 애니메이션 효과를 달성하는 방법은 무엇입니까? 또는: Shiseido의 공식 웹 사이트와 같은 페이지 스크롤과 함께 애니메이션 효과를 어떻게 달성 할 수 있습니까? Apr 04, 2025 pm 05:36 PM

이 기사에서 시차 스크롤 및 요소 애니메이션 효과 실현에 대한 토론은 Shiseido 공식 웹 사이트 (https://www.shiseido.co.jp/sb/wonderland/)와 유사하게 달성하는 방법을 살펴볼 것입니다.

JavaScript의 진화 : 현재 동향과 미래 전망 JavaScript의 진화 : 현재 동향과 미래 전망 Apr 10, 2025 am 09:33 AM

JavaScript의 최신 트렌드에는 Typescript의 Rise, 현대 프레임 워크 및 라이브러리의 인기 및 WebAssembly의 적용이 포함됩니다. 향후 전망은보다 강력한 유형 시스템, 서버 측 JavaScript 개발, 인공 지능 및 기계 학습의 확장, IoT 및 Edge 컴퓨팅의 잠재력을 포함합니다.

JavaScript를 사용하여 동일한 ID와 동일한 ID로 배열 요소를 하나의 객체로 병합하는 방법은 무엇입니까? JavaScript를 사용하여 동일한 ID와 동일한 ID로 배열 요소를 하나의 객체로 병합하는 방법은 무엇입니까? Apr 04, 2025 pm 05:09 PM

동일한 ID로 배열 요소를 JavaScript의 하나의 객체로 병합하는 방법은 무엇입니까? 데이터를 처리 할 때 종종 동일한 ID를 가질 필요가 있습니다 ...

Console.log 출력 결과의 차이 : 두 통화가 다른 이유는 무엇입니까? Console.log 출력 결과의 차이 : 두 통화가 다른 이유는 무엇입니까? Apr 04, 2025 pm 05:12 PM

Console.log 출력의 차이의 근본 원인에 대한 심층적 인 논의. 이 기사에서는 Console.log 함수의 출력 결과의 차이점을 코드에서 분석하고 그에 따른 이유를 설명합니다. � ...

See all articles