Structures de données et algorithmes en JavaScript (5) : compétences classiques KMP algorithm

Maison

interface Web

js tutoriel

Structures de données et algorithmes en JavaScript (5) : compétences classiques KMP algorithm_javascript

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 16, 2016 pm 03:54 PM

javascript kmp 数据结构算法经典

Algorithme KMP et algorithme BM

KMP est un algorithme classique pour la correspondance de préfixes et la correspondance de suffixes BM. On peut voir que la différence entre la correspondance de préfixes et la correspondance de suffixes n'est que dans l'ordre de comparaison

La correspondance de préfixe signifie : la comparaison de la chaîne de modèle et de la chaîne parent se fait de gauche à droite, et le mouvement de la chaîne de modèle se fait également de gauche à droite

La correspondance de suffixe signifie : la comparaison de la chaîne de modèle et de la chaîne parent se fait de droite à gauche, et le mouvement de la chaîne de modèle se fait de gauche à droite.

À travers le chapitre précédent il est évident que l'algorithme BF est aussi un algorithme de préfixe, mais l'efficacité de la correspondance un par un est très arrogante. Naturellement, il n'est pas nécessaire de mentionner O(. mn). KMP, ce qui est ennuyeux en ligne, explique beaucoup de choses. Ils empruntent essentiellement la voie du haut niveau et vous pourriez être confus. J'ai essayé d'utiliser ma propre compréhension pour le décrire de la manière la plus terre-à-terre

KMP

KMP est également une version optimisée de l'algorithme de préfixe. La raison pour laquelle il s'appelle KMP est l'abréviation des trois noms de Knuth, Morris et Pratt. Par rapport à BF, le point d'optimisation de l'algorithme KMP est "le". distance de chaque mouvement vers l'arrière" Il ajustera dynamiquement la distance de déplacement de chaque chaîne de motif. BF est 1 à chaque fois,

Pas forcément pour KMP

Comme le montre la figure, la différence entre les pré-algorithmes BF et KMP est comparée

J'ai comparé les photos et j'ai découvert :

Recherchez la chaîne de motif P dans la chaîne de texte T. Lorsqu'elle correspond naturellement à la sixième lettre c, on constate que le deuxième niveau est incohérent. Ensuite, la méthode BF consiste à déplacer toute la chaîne de motif P d'une place, et KMP doit le déplacer de deux places.

Nous connaissons la méthode de correspondance de BF, mais pourquoi KMP déplace-t-il deux chiffres au lieu d'un ou trois ou quatre chiffres ?

Expliquons l'image précédente. La chaîne de motif P est correcte lorsqu'elle correspond à ababa, et elle est fausse lorsqu'elle correspond à c. Alors l'idée de l'algorithme KMP est : ababa correspond correctement à l'information, peut. nous utilisons ces informations pour ne pas ramener la « position de recherche » à la position qui a été comparée, mais continuer à la déplacer vers l'arrière, ce qui améliore l'efficacité.

Alors la question est : comment puis-je savoir combien de postes déplacer ?

Les auteurs de cet algorithme de décalage KMP nous l'ont résumé :

Copier le code Le code est le suivant :

Chiffres changeants = Nombre de caractères correspondants - Valeur de correspondance partielle correspondante

L'algorithme de décalage n'est lié qu'aux sous-chaînes, pas aux chaînes de texte, une attention particulière doit donc être accordée ici
Alors, comment comprendre le nombre de caractères correspondant dans la sous-chaîne et la valeur de correspondance partielle correspondante ?

Caractères correspondants :

Copier le code Le code est le suivant :

T : abababaabab

p : ababacb

La marque rouge en p est le caractère correspondant, facile à comprendre

Valeur de correspondance partielle :

C'est l'algorithme de base, et il est également difficile à comprendre

Si :

Copier le code Le code est le suivant :

T：aaronaabbcc

P：aaronaac

Nous pouvons observer ce texte. Si nous faisons une erreur lors de la correspondance avec c, où sera notre prochain mouvement basé sur la structure précédente ? Où est le mouvement le plus raisonnable ?

Copier le code Le code est le suivant :

Aaronaabcc
Aaronac

C'est-à-dire : dans le texte du modèle, si le début et la fin d'un certain paragraphe de caractères sont les mêmes, alors ce paragraphe de contenu peut être ignoré lors du filtrage naturel. Cette idée est également raisonnable

Connaissant cette règle, l'algorithme de table de correspondance partielle donné est le suivant :

Tout d'abord, vous devez comprendre deux concepts : « préfixe » et « suffixe ». « Préfixe » fait référence à toutes les combinaisons de têtes d'une chaîne à l'exception du dernier caractère ; « suffixe » fait référence à toutes les combinaisons de queue d'une chaîne à l'exception du premier caractère.

"Valeur de correspondance partielle" est la longueur de l'élément commun le plus long entre "préfixe" et "suffixe""

Jetons un coup d'œil à la division Aaronaac s'il s'agit d'un match BF

Déplacement de BF : a,aa,aar,aaro,aaron,aarona,aaronaa,aaronaac

Et alors, qu’en est-il des divisions de KMP ? Ici, nous devons introduire les préfixes et les suffixes

Regardons d'abord les résultats du tableau de correspondance partielle KMP :

Copier le code Le code est le suivant :

a a r o n a a c

[0, 1, 0, 0, 0, 1, 2, 0]

Je suis vraiment confus, alors ne vous inquiétez pas, décomposons-le, préfixes et suffixes

Copier le code Le code est le suivant :

Chaîne de correspondance : "Aaron"

Préfixe : A, Aa, Aar, Aaro

Suffixe : aron,ron,on,n

Position de déplacement : En fait, il s'agit de comparer le préfixe et le suffixe de chaque caractère correspondant pour voir s'ils sont égaux, puis de calculer la longueur totale

Décomposition du tableau de correspondance partielle

L'algorithme de table de correspondance dans KMP, où p représente le préfixe, n représente le suffixe et r représente le résultat

Copier le code Le code est le suivant :

a, p=>0, n=>0 r = 0

aa, p=>[a], n=>[a], r = a.length => 1

aar, p=>[a,aa], n=>[r,ar] ,r = 0

aaro, p=>[a,aa,aar], n=>[o,ra,aro] ,r = 0

aaron p=>[a,aa,aar,aaro], n=>[n,on,ron,aron] ,r = 0

aarona, p=>[a,aa,aar,aaro,aaron], n=>[a,na,ona,rona,arona] ,r = a.longueur = 1

aaronaa, p=>[a,aa,aar,aaro,aaron,aarona], n=>[a,aa,naa,onaa,ronaa,aronaa] , r = Math.max(a.length ,aa.longueur) = 2

aaronaac p=>[a,aa,aar,aaro,aaron,aarona], n=>[c,ac,aac,naac,onaac,ronaac] r = 0

Semblable à l'algorithme BF, décomposez d'abord la position de chaque indice de correspondance possible et mettez-le en cache. Lors de la correspondance, utilisez ce "tableau de correspondance partielle" pour localiser le nombre de chiffres qui doivent être déplacés

Le résultat final du tableau de correspondance d'aaronaac est donc 0,1,0,0,0,1,2,0

La version JS de KMP sera implémentée ci-dessous, il en existe 2 types

Implémentation KMP (1) : table de correspondance de mise en cache KMP

Implémentation KMP (2) : calculer dynamiquement le prochain KMP

Implémentation KMP (1)

Table assortie

La chose la plus importante dans l'algorithme KMP est la table de correspondance. Si la table de correspondance n'est pas requise, alors c'est l'implémentation de BF. L'ajout de la table de correspondance est KMP

Le tableau de correspondance détermine le prochain nombre de déplacements

Sur la base des règles du tableau de correspondance ci-dessus, nous concevons une méthode kmpGetStrPartMatchValue

function kmpGetStrPartMatchValue(str) {
   var prefix = [];
   var suffix = [];
   var partMatch = [];
   for (var i = 0, j = str.length; i < j; i++) {
    var newStr = str.substring(0, i + 1);
    if (newStr.length == 1) {
     partMatch[i] = 0;
    } else {
     for (var k = 0; k < i; k++) {
      //前缀
      prefix[k] = newStr.slice(0, k + 1);
      //后缀
      suffix[k] = newStr.slice(-k - 1);
      //如果相等就计算大小,并放入结果集中
      if (prefix[k] == suffix[k]) {
       partMatch[i] = prefix[k].length;
      }
     }
     if (!partMatch[i]) {
      partMatch[i] = 0;
     }
    }
   }
   return partMatch;
  }

Copier après la connexion

Tout à fait conforme à l'implémentation de l'algorithme de table de correspondance dans KMP, a->aa->aar->aaro->aaron->aarona-> je 1) aaronaa-aaronaac

Calculez ensuite la longueur des éléments communs par préfixe et suffixe dans chaque décomposition

Algorithme de recul

KMP est également un algorithme frontal. Vous pouvez transférer complètement celui de BF. La seule modification est que BF ajoute directement 1 lors du retour en arrière. Lorsque KMP revient en arrière, nous pouvons calculer la valeur suivante via la table de correspondance
.

//子循环
for (var j = 0; j < searchLength; j++) {
  //如果与主串匹配
  if (searchStr.charAt(j) == sourceStr.charAt(i)) {
    //如果是匹配完成
    if (j == searchLength - 1) {
     result = i - j;
     break;
    } else {
     //如果匹配到了，就继续循环，i++是用来增加主串的下标位
     i++;
    }
  } else {
   //在子串的匹配中i是被叠加了
   if (j > 1 && part[j - 1] > 0) {
    i += (i - j - part[j - 1]);
   } else {
    //移动一位
    i = (i - j)
   }
   break;
  }
}

Copier après la connexion

La marque rouge est le point central de KMP La valeur de next = le nombre de caractères correspondants - la valeur de correspondance partielle correspondante

Algorithme KMP complet

<!doctype html><div id="test2"><div><script type="text/javascript">
 

  function kmpGetStrPartMatchValue(str) {
   var prefix = [];
   var suffix = [];
   var partMatch = [];
   for (var i = 0, j = str.length; i < j; i++) {
    var newStr = str.substring(0, i + 1);
    if (newStr.length == 1) {
     partMatch[i] = 0;
    } else {
     for (var k = 0; k < i; k++) {
      //取前缀
      prefix[k] = newStr.slice(0, k + 1);
      suffix[k] = newStr.slice(-k - 1);
      if (prefix[k] == suffix[k]) {
       partMatch[i] = prefix[k].length;
      }
     }
     if (!partMatch[i]) {
      partMatch[i] = 0;
     }
    }
   }
   return partMatch;
  }



function KMP(sourceStr, searchStr) {
  //生成匹配表
  var part     = kmpGetStrPartMatchValue(searchStr);
  var sourceLength = sourceStr.length;
  var searchLength = searchStr.length;
  var result;
  var i = 0;
  var j = 0;

  for (; i < sourceStr.length; i++) { //最外层循环，主串

    //子循环
    for (var j = 0; j < searchLength; j++) {
      //如果与主串匹配
      if (searchStr.charAt(j) == sourceStr.charAt(i)) {
        //如果是匹配完成
        if (j == searchLength - 1) {
         result = i - j;
         break;
        } else {
         //如果匹配到了，就继续循环，i++是用来增加主串的下标位
         i++;
        }
      } else {
       //在子串的匹配中i是被叠加了
       if (j > 1 && part[j - 1] > 0) {
        i += (i - j - part[j - 1]);
       } else {
        //移动一位
        i = (i - j)
       }
       break;
      }
    }

    if (result || result == 0) {
     break;
    }
  }


  if (result || result == 0) {
   return result
  } else {
   return -1;
  }
}

 var s = "BBC ABCDAB ABCDABCDABDE";
 var t = "ABCDABD";


 show('indexOf',function() {
  return s.indexOf(t)
 })

 show('KMP',function() {
  return KMP(s,t)
 })

 function show(bf_name,fn) {
  var myDate = +new Date()
  var r = fn();
  var div = document.createElement('div')
  div.innerHTML = bf_name +'算法,搜索位置:' + r + ",耗时" + (+new Date() - myDate) + "ms";
   document.getElementById("test2").appendChild(div);
 }


</script></div></div>

Copier après la connexion

KMP（二）

第一种kmp的算法很明显，是通过缓存查找匹配表也就是常见的空间换时间了。那么另一种就是时时查找的算法，通过传递一个具体的完成字符串，算出这个匹配值出来，原理都一样

生成缓存表的时候是整体全部算出来的，我们现在等于只要挑其中的一条就可以了，那么只要算法定位到当然的匹配即可

next算法

function next(str) {
  var prefix = [];
  var suffix = [];
  var partMatch;
  var i = str.length
  var newStr = str.substring(0, i + 1);
  for (var k = 0; k < i; k++) {
   //取前缀
   prefix[k] = newStr.slice(0, k + 1);
   suffix[k] = newStr.slice(-k - 1);
   if (prefix[k] == suffix[k]) {
    partMatch = prefix[k].length;
   }
  }
  if (!partMatch) {
   partMatch = 0;
  }
  return partMatch;
}

Copier après la connexion

其实跟匹配表是一样的，去掉了循环直接定位到当前已成功匹配的串了

完整的KMP.next算法

<!doctype html><div id="testnext"><div><script type="text/javascript">
 
  function next(str) {
    var prefix = [];
    var suffix = [];
    var partMatch;
    var i = str.length
    var newStr = str.substring(0, i + 1);
    for (var k = 0; k < i; k++) {
     //取前缀
     prefix[k] = newStr.slice(0, k + 1);
     suffix[k] = newStr.slice(-k - 1);
     if (prefix[k] == suffix[k]) {
      partMatch = prefix[k].length;
     }
    }
    if (!partMatch) {
     partMatch = 0;
    }
    return partMatch;
  }

  function KMP(sourceStr, searchStr) {
    var sourceLength = sourceStr.length;
    var searchLength = searchStr.length;
    var result;
    var i = 0;
    var j = 0;

    for (; i < sourceStr.length; i++) { //最外层循环，主串

      //子循环
      for (var j = 0; j < searchLength; j++) {
        //如果与主串匹配
        if (searchStr.charAt(j) == sourceStr.charAt(i)) {
          //如果是匹配完成
          if (j == searchLength - 1) {
           result = i - j;
           break;
          } else {
           //如果匹配到了，就继续循环，i++是用来增加主串的下标位
           i++;
          }
        } else {
         if (j > 1) {
          i += i - next(searchStr.slice(0,j));
         } else {
          //移动一位
          i = (i - j)
         }
         break;
        }
      }

      if (result || result == 0) {
       break;
      }
    }


    if (result || result == 0) {
     return result
    } else {
     return -1;
    }
  }

 var s = "BBC ABCDAB ABCDABCDABDE";
 var t = "ABCDAB";


  show('indexOf',function() {
   return s.indexOf(t)
  })

  show('KMP.next',function() {
   return KMP(s,t)
  })

  function show(bf_name,fn) {
   var myDate = +new Date()
   var r = fn();
   var div = document.createElement('div')
   div.innerHTML = bf_name +'算法,搜索位置:' + r + ",耗时" + (+new Date() - myDate) + "ms";
    document.getElementById("testnext").appendChild(div);
  }

</script></div></div>

Copier après la connexion

git代码下载: https://github.com/JsAaron/data_structure

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

Assassin's Creed Shadows - Comment trouver le forgeron et déverrouiller les armes et la personnalisation des armes

1 Il y a quelques mois By DDD

<🎜>: Dead Rails - Comment relever chaque défi

3 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7612

Tutoriel CakePHP

1387

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

136

Afficher plus

Related knowledge

Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Jun 03, 2024 pm 01:25 PM

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

Explorez les principes sous-jacents et la sélection d'algorithmes de la fonction de tri C++ Apr 02, 2024 pm 05:36 PM

La couche inférieure de la fonction de tri C++ utilise le tri par fusion, sa complexité est O(nlogn) et propose différents choix d'algorithmes de tri, notamment le tri rapide, le tri par tas et le tri stable.

Comparez des structures de données complexes à l'aide de la comparaison de fonctions Java Apr 19, 2024 pm 10:24 PM

Lors de l'utilisation de structures de données complexes en Java, Comparator est utilisé pour fournir un mécanisme de comparaison flexible. Les étapes spécifiques comprennent : la définition d’une classe de comparaison et la réécriture de la méthode de comparaison pour définir la logique de comparaison. Créez une instance de comparaison. Utilisez la méthode Collections.sort, en transmettant les instances de collection et de comparateur.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution Jun 06, 2024 pm 12:33 PM

01Aperçu des perspectives Actuellement, il est difficile d'atteindre un équilibre approprié entre efficacité de détection et résultats de détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse. 02 Contexte et motivation Avec le développement rapide de la technologie de télédétection, les images de télédétection optique à haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. Détection d'objets dans l'interprétation d'images de télédétection

Structures de données et algorithmes Java : explication détaillée May 08, 2024 pm 10:12 PM

Les structures de données et les algorithmes sont à la base du développement Java. Cet article explore en profondeur les structures de données clés (telles que les tableaux, les listes chaînées, les arbres, etc.) et les algorithmes (tels que le tri, la recherche, les algorithmes graphiques, etc.) en Java. Ces structures sont illustrées par des exemples pratiques, notamment l'utilisation de tableaux pour stocker les scores, de listes chaînées pour gérer les listes de courses, de piles pour implémenter la récursion, de files d'attente pour synchroniser les threads, ainsi que d'arbres et de tables de hachage pour une recherche et une authentification rapides. Comprendre ces concepts vous permet d'écrire du code Java efficace et maintenable.

Application d'algorithmes dans la construction de 58 plateformes de portraits May 09, 2024 am 09:01 AM

1. Contexte de la construction de la plateforme 58 Portraits Tout d'abord, je voudrais partager avec vous le contexte de la construction de la plateforme 58 Portraits. 1. La pensée traditionnelle de la plate-forme de profilage traditionnelle ne suffit plus. La création d'une plate-forme de profilage des utilisateurs s'appuie sur des capacités de modélisation d'entrepôt de données pour intégrer les données de plusieurs secteurs d'activité afin de créer des portraits d'utilisateurs précis. Elle nécessite également l'exploration de données pour comprendre le comportement et les intérêts des utilisateurs. et besoins, et fournir des capacités côté algorithmes ; enfin, il doit également disposer de capacités de plate-forme de données pour stocker, interroger et partager efficacement les données de profil utilisateur et fournir des services de profil. La principale différence entre une plate-forme de profilage d'entreprise auto-construite et une plate-forme de profilage de middle-office est que la plate-forme de profilage auto-construite dessert un seul secteur d'activité et peut être personnalisée à la demande. La plate-forme de mid-office dessert plusieurs secteurs d'activité et est complexe ; modélisation et offre des fonctionnalités plus générales. 2.58 Portraits d'utilisateurs de l'arrière-plan de la construction du portrait sur la plate-forme médiane 58

Structure de données PHP : l'équilibre des arborescences AVL, maintenant une structure de données efficace et ordonnée Jun 03, 2024 am 09:58 AM

L'arbre AVL est un arbre de recherche binaire équilibré qui garantit des opérations de données rapides et efficaces. Pour atteindre l'équilibre, il effectue des opérations de virage à gauche et à droite, en ajustant les sous-arbres qui violent l'équilibre. Les arbres AVL utilisent l'équilibrage de hauteur pour garantir que la hauteur de l'arbre est toujours petite par rapport au nombre de nœuds, réalisant ainsi des opérations de recherche de complexité temporelle logarithmique (O (logn)) et maintenant l'efficacité de la structure de données même sur de grands ensembles de données.

Algorithme de recommandation d'actualités basé sur l'amélioration globale des graphiques Apr 08, 2024 pm 09:16 PM

Auteur | Évalué par Wang Hao | L'application Chonglou News est un moyen important pour les gens d'obtenir des sources d'informations dans leur vie quotidienne. Vers 2010, les applications d'information étrangères populaires comprenaient Zite et Flipboard, tandis que les applications d'information nationales populaires étaient principalement les quatre principaux portails. Avec la popularité des produits de recommandation d'actualités d'une nouvelle ère représentés par Toutiao, les applications d'actualités sont entrées dans une nouvelle ère. Quant aux entreprises technologiques, quelle qu'elles soient, tant qu'elles maîtrisent la technologie sophistiquée des algorithmes de recommandation d'actualités, elles auront fondamentalement l'initiative et la voix au niveau technique. Aujourd'hui, jetons un coup d'œil à un article du RecSys2023 Best Long Paper Nomination Award : GoingBeyondLocal:GlobalGraph-EnhancedP.

See all articles