Maison > base de données > tutoriel mysql > Comment puis-je réaliser des recherches insensibles aux accents dans PostgreSQL ?

Comment puis-je réaliser des recherches insensibles aux accents dans PostgreSQL ?

Linda Hamilton
Libérer: 2025-01-20 12:21:17
original
541 Les gens l'ont consulté

How Can I Achieve Accent-Insensitive Searches in PostgreSQL?

Approche PostgreSQL de la recherche insensible aux accents

Contrairement à certaines bases de données (comme Microsoft SQL Server), PostgreSQL ne prend pas en charge nativement les classements insensibles aux accents. Alors que PostgreSQL 12 a introduit des classements ICU non déterministes offrant une insensibilité à la casse et à l'accent, ceux-ci s'accompagnent de compromis en termes de performances et de restrictions opérationnelles.

Stratégies pour les requêtes insensibles aux accents dans PostgreSQL

Il existe plusieurs méthodes pour réaliser une recherche insensible aux accents dans PostgreSQL :

1. Le unaccentModule :

Ce module fournit la fonction unaccent(), supprimant les accents des chaînes. Cela permet des requêtes telles que :

SELECT * FROM users WHERE unaccent(name) = unaccent('João');
Copier après la connexion

Cependant, unaccent() n'est pas IMMUTABLE, ce qui empêche son utilisation dans les index d'expression, et il ne développe pas les ligatures (par exemple, 'Œ').

2. Wrapper de fonction C optimisé :

Pour répondre aux limitations de unaccent(), une solution plus efficace consiste à créer un wrapper de fonction C IMMUTABLE :

CREATE OR REPLACE FUNCTION public.f_unaccent(text)
  RETURNS text
  LANGUAGE sql IMMUTABLE PARALLEL SAFE STRICT
RETURN public.immutable_unaccent(regdictionary 'public.unaccent', );
Copier après la connexion

Cela permet la création d'index d'expression :

CREATE INDEX users_unaccent_name_idx ON users(public.f_unaccent(name));
Copier après la connexion

Les requêtes utilisent ensuite la fonction enveloppée :

SELECT * FROM users WHERE f_unaccent(name) = f_unaccent('João');
Copier après la connexion

3. Tirer parti de pg_trgm pour la correspondance de motifs et les ligatures :

Pour une correspondance de motifs et une gestion des ligatures plus flexibles, le module pg_trgm avec index trigrammes offre une solution puissante. Un index trigramme GIN permet des recherches insensibles à la casse et une détection de similarité :

CREATE INDEX users_unaccent_name_trgm_idx ON users
USING gin (f_unaccent(name) gin_trgm_ops);

SELECT * FROM users WHERE f_unaccent(name) LIKE ('%' || f_unaccent('João') || '%');
Copier après la connexion

Notez que pg_trgm les index sont plus gourmands en ressources que les index B-tree standard.

Le choix de l'approche optimale dépend des besoins spécifiques de votre application, de l'équilibre entre les performances des requêtes, les coûts de maintenance des index et les exigences de gestion des ligatures.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal