Véritable tri alphanumérique/naturel dans MySQL - pourquoi la réponse est-elle toujours récursive ?-tutoriel mysql-php.cn

Maison

base de données

tutoriel mysql

Véritable tri alphanumérique/naturel dans MySQL - pourquoi la réponse est-elle toujours récursive ?

Mary-Kate Olsen

Nov 23, 2024 pm 12:55 PM

True Alphanumeric / natural sorting in MySQL - why is the answer always recursion?

Hier, j'ai tenté de résoudre le tri alphanumérique dans MySQL et j'ai échoué. (lire cet article ici)

Je me suis quand même approché et j'ai eu le bon concept, juste une mauvaise exécution.

Aujourd'hui, je me suis réveillé et j'ai eu une révélation... récursion.

Le problème avec la récursivité est qu'il faut comprendre la récursivité pour pouvoir faire de la récursion... et je ne comprends pas suffisamment la récursivité pour faire de la récursivité dans MySQL.

Cependant, avec un peu de Chat Gippity dans les deux sens (j'entends par là lui faire écrire ce que j'ai demandé, récupérer environ 25 % de ce que j'ai demandé, le réparer et l'alimenter dans un nouveau chat pour que ce ne soit pas le cas) (ne continue pas à se répéter pendant environ 2 heures) J'ai obtenu une réponse fonctionnelle !

Au point

Puis-je vous présenter mon chant du cygne, mon chef-d'œuvre, la réponse à la vie elle-même (ok très bien, la seule solution efficace au véritable tri alphanumérique dans MySQL que j'ai vue).

WITH RECURSIVE process_numbers AS (
    SELECT 
        data_value,
        data_value AS remaining_data,
        CAST('' AS CHAR(20000)) AS processed_data,
        1 AS iteration
    FROM test_data

    UNION ALL

    SELECT
        data_value,
        CASE 
            WHEN LOCATE(REGEXP_SUBSTR(remaining_data, '[0-9]+'), remaining_data) > 0 THEN
                SUBSTRING(
                    remaining_data,
                    LOCATE(REGEXP_SUBSTR(remaining_data, '[0-9]+'), remaining_data)
                    + LENGTH(REGEXP_SUBSTR(remaining_data, '[0-9]+'))
                )
            ELSE '' 
        END AS remaining_data,

        CONCAT(
            processed_data,
            CASE 
                WHEN LOCATE(REGEXP_SUBSTR(remaining_data, '[0-9]+'), remaining_data) > 0 THEN
                    LEFT(remaining_data, LOCATE(REGEXP_SUBSTR(remaining_data, '[0-9]+'), remaining_data) - 1)
                ELSE remaining_data
            END,
            CASE
                WHEN REGEXP_SUBSTR(remaining_data, '[0-9]+') IS NOT NULL THEN
                    RIGHT(CONCAT('0000000000', REGEXP_SUBSTR(remaining_data, '[0-9]+')), 10)
                ELSE ''
            END
        ) AS processed_data,

        iteration + 1
    FROM process_numbers
    WHERE LENGTH(remaining_data) > 0
          AND iteration < 100
)


SELECT 
    data_value,
    CONCAT(processed_data, remaining_data) AS sort_key
FROM process_numbers
WHERE remaining_data = ""
ORDER BY sort_key;

Copier après la connexion

Et si vous voulez l'essayer (et essayer de le casser), vous pouvez jouer avec ce violon DB

Alors, comment ça marche ?

Il fait ce que je voulais faire à l'origine, prendre chaque groupe de nombres et les compléter à 10 chiffres au total.

Donc, évidemment, si vous alimentez ceci avec quelques chaînes avec 11 chiffres numériques consécutifs, cela ne fonctionnera pas sans ajustement, mais à part ça, cela fonctionne bien !

Vous voyez, MySQL peut trier les nombres correctement, même en mode de classement lexicographique, mais il a un défaut.

Il considère "11" comme plus petit que "2" car il trie un caractère à la fois (efficacement). Donc "2" est plus grand que "1", donc il vient en premier. Ensuite, il vérifie le caractère suivant, auquel cas le tri est incorrect (au moins pour les nombres).

Pour mieux comprendre cela, imaginez si 1 était réellement la lettre "b" et 2 était la lettre "c".

C'est ainsi que MySQL "voit" les nombres, ce ne sont que des caractères comme les autres.

Donc, si j'avais "bb" et "c", vous vous attendriez à ce que "bb" vienne avant "c". Maintenant, échangez les chiffres et vous comprendrez pourquoi « 11 » vient avant « 2 ».

Alors c'est un hack ?

Oui, nous supprimons le problème en déplaçant les chiffres vers l'arrière via le remplissage.

Pour en revenir à notre exemple, si nous complétons "11" et "2" à 3 en longueur et utilisons "a" comme 0, voici ce qui se passe :

011 = abb
002 = aac

Copier après la connexion

remarquez comment se déroulerait maintenant le tri :

caractère 1 : est-ce que "a" est plus grand que "a" - non, ce sont les mêmes.
caractère 2 : est-ce que "b" est plus grand que "a" - oui, mettez le "a" avant le "b"
personnage 3 : n'est plus pertinent et nous avons déjà trouvé une occurrence plus tôt qui était différente et plus grande.

Donc, selon cette logique, nous avons maintenant :

002 = aac (the second "a" comes before the second "b" in the next row)
011 = abb

Copier après la connexion

Et c'est comme ça que ça marche !

Allez-vous expliquer le truc de la récursion ?

En quelque sorte. J'ai fait le tour des maisons avec celui-ci et mes connaissances sont superficielles, mais je vais essayer.

Le problème venait du fonctionnement de RegEx dans MySQL. REGEX_SUBSTR ne trouvera qu'une seule correspondance, puis continuera à la renvoyer pour chaque autre correspondance trouvée. C'est pourquoi ma solution d'hier ne fonctionnait pas correctement.

Mais REGEX_REPLACE a ses propres problèmes où il ne semble pas exposer correctement la longueur de chaîne d'une correspondance (nous ne pouvons donc pas LPAD avec correctement)

C'est pourquoi j'ai pensé à la récursivité comme réponse.

Je peux utiliser REGEX_SUBSTR pour obtenir le comportement de remplissage correct, et comme chaque boucle via RegEx est essentiellement un nouvel appel de fonction, elle ne "se souvient" pas de la correspondance précédente, donc cela résout ce problème.

Et si vous voulez un bref aperçu de la logique, ce n'est en fait pas aussi effrayant qu'il y paraît !

Nous parcourons une chaîne donnée, à la recherche de n'importe quel nombre (le nombre entier, pas seulement un seul caractère).
Nous supprimons ensuite cela de left_data afin de ne plus le faire correspondre.
Nous prenons le numéro que nous venons de faire correspondre et le complétons pour qu'il comporte 10 chiffres au total.
Nous recherchons ensuite la partie numérique suivante dans la chaîne et répétons le processus, en créantprocessed_data comme notre chaîne finale.
Enfin, une fois que nous n'avons plus de nombres à traiter, nous ajoutons les lettres restantes à la fin de Processed_data pour terminer la transformation et nous le renvoyons sous sort_key.

Ensuite, nous pouvons utiliser cette clé de tri dans notre requête pour trier correctement la colonne.

Et la partie itération est purement un outil de sauvegarde, pour s'assurer qu'elle ne manque pas complètement de mémoire au serveur MySQL ou ne plante pas la requête si une chaîne suffisamment complexe est traitée (ou s'il y a une erreur dans la logique qui signifie cela se reproduirait pour toujours).

C'est fini !

N'est-ce pas drôle à quel point dormir sur des choses apporte une nouvelle perspective ?

Peut-être devrais-je essayer le sommeil polyphasique pour pouvoir dormir sur des problèmes 2 à 3 fois plus souvent chaque jour et devenir un développeur 10x ? haha.

Quoi qu'il en soit, voilà, un vrai tri alphanumérique raisonnablement robuste.

Oh et en réalité, vous devriez probablement convertir la clé de tri en une colonne stockée sur votre base de données à l'aide de GENERATE ou d'une procédure stockée. Malheureusement, le terrain de jeu que j'utilise ne semble pas supporter cela et c'est un dimanche donc je vous laisse le soin, cher spectateur !

Passez une bonne fin de week-end et une bonne semaine.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

4 Il y a quelques semaines By DDD

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semaines By DDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Nordhold: Système de fusion, expliqué

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel Java

1669

Tutoriel CakePHP

1428

Tutoriel Laravel

1329

Tutoriel PHP

1273

Tutoriel C#

1256

Afficher plus

Related knowledge

Rôle de MySQL: Bases de données dans les applications Web Apr 17, 2025 am 12:23 AM

Le rôle principal de MySQL dans les applications Web est de stocker et de gérer les données. 1.MySQL traite efficacement les informations utilisateur, les catalogues de produits, les enregistrements de transaction et autres données. 2. Grâce à SQL Query, les développeurs peuvent extraire des informations de la base de données pour générer du contenu dynamique. 3.MySQL fonctionne basé sur le modèle client-serveur pour assurer une vitesse de requête acceptable.

Expliquez le rôle des journaux de rétablissement innodb et des journaux d'annulation. Apr 15, 2025 am 12:16 AM

INNODB utilise des redologues et des undologs pour assurer la cohérence et la fiabilité des données. 1. REDOLOGIE RÉCLABLIER MODIFICATION DE PAGE DES DONNÉES Pour assurer la récupération des accidents et la persistance des transactions. 2.Undologs Enregistre la valeur des données d'origine et prend en charge le Rollback de la transaction et MVCC.

MySQL vs d'autres langages de programmation: une comparaison Apr 19, 2025 am 12:22 AM

Par rapport à d'autres langages de programmation, MySQL est principalement utilisé pour stocker et gérer les données, tandis que d'autres langages tels que Python, Java et C sont utilisés pour le traitement logique et le développement d'applications. MySQL est connu pour ses performances élevées, son évolutivité et son support multiplateforme, adapté aux besoins de gestion des données, tandis que d'autres langues présentent des avantages dans leurs domaines respectifs tels que l'analyse des données, les applications d'entreprise et la programmation système.

Comment la cardinalité d'index MySQL affecte-t-elle les performances de la requête? Apr 14, 2025 am 12:18 AM

La cardinalité de l'index MySQL a un impact significatif sur les performances de la requête: 1. L'indice de cardinalité élevé peut réduire plus efficacement la plage de données et améliorer l'efficacité de la requête; 2. L'indice de cardinalité faible peut entraîner une analyse complète de la table et réduire les performances de la requête; 3. Dans l'indice conjoint, des séquences de cardinalité élevées doivent être placées devant pour optimiser la requête.

MySQL pour les débutants: commencer la gestion de la base de données Apr 18, 2025 am 12:10 AM

Les opérations de base de MySQL incluent la création de bases de données, les tables et l'utilisation de SQL pour effectuer des opérations CRUD sur les données. 1. Créez une base de données: CreatedAtAbaseMy_First_DB; 2. Créez un tableau: CreateTableBooks (idIntauto_inCmentPrimaryKey, TitleVarchar (100) notnull, AuthorVarchar (100) notnull, publied_yearint); 3. Données d'insertion: INSERTINTOBOOKS (titre, auteur, publié_year) VA

Mysql vs autres bases de données: comparaison des options Apr 15, 2025 am 12:08 AM

MySQL convient aux applications Web et aux systèmes de gestion de contenu et est populaire pour son open source, ses performances élevées et sa facilité d'utilisation. 1) Par rapport à PostgreSQL, MySQL fonctionne mieux dans les requêtes simples et les opérations de lecture simultanées élevées. 2) Par rapport à Oracle, MySQL est plus populaire parmi les petites et moyennes entreprises en raison de son open source et de son faible coût. 3) Par rapport à Microsoft SQL Server, MySQL est plus adapté aux applications multiplateformes. 4) Contrairement à MongoDB, MySQL est plus adapté aux données structurées et au traitement des transactions.

Expliquez le pool de tampons InNODB et son importance pour la performance. Apr 19, 2025 am 12:24 AM

InnodBBufferPool réduit les E / S de disque en mettant en cache des données et des pages d'indexation, améliorant les performances de la base de données. Son principe de travail comprend: 1. La lecture des données: lire les données de BufferPool; 2. Écriture de données: Après avoir modifié les données, écrivez dans BufferPool et actualisez-les régulièrement sur le disque; 3. Gestion du cache: utilisez l'algorithme LRU pour gérer les pages de cache; 4. Mécanisme de lecture: Chargez à l'avance des pages de données adjacentes. En dimensionner le tampon et en utilisant plusieurs instances, les performances de la base de données peuvent être optimisées.

MySQL: données structurées et bases de données relationnelles Apr 18, 2025 am 12:22 AM

MySQL gère efficacement les données structurées par la structure de la table et la requête SQL, et met en œuvre des relations inter-tableaux à travers des clés étrangères. 1. Définissez le format de données et tapez lors de la création d'une table. 2. Utilisez des clés étrangères pour établir des relations entre les tables. 3. Améliorer les performances par l'indexation et l'optimisation des requêtes. 4. Bases de données régulièrement sauvegarde et surveillent régulièrement la sécurité des données et l'optimisation des performances.

See all articles