目次
文字列検索" >文字列検索
abababca を例として取り上げます。 " >すべてのプレフィックスとサフィックスが数量的に対称であることがわかります。次に、プレフィックスから 1 つを見つけて、それをサフィックスと照合します。この試合の意味。最初のテキスト abababca を例として取り上げます。
Javascript 中的实现" >Javascript 中的实现
ホームページ ウェブフロントエンド jsチュートリアル KMPアルゴリズムを簡単に理解できるようにする

KMPアルゴリズムを簡単に理解できるようにする

Apr 30, 2019 pm 02:25 PM
js kmp アルゴリズム

KMP (Knuth-Morris-Pratt Algorithm) アルゴリズムは、文字列から特定の部分文字列を見つけるための文字列マッチングに使用されます。しかし、それを理解して習得するのはそれほど簡単ではありません。部分一致テーブルの概念を理解することが、KMP アルゴリズムを理解する鍵となります。

ここでの議論は、その背後にあるあいまいなロジックを避け、その応用から理解することに焦点を当てています。

文字列検索

たとえば、文字列 abcdef から部分文字列 abcdg を検索します。

簡単な解決策です。

  • 最初の桁をそれぞれ取り出して照合し、それらが同じ場合は 2 番目の桁を取り出します。
  • それらが異なる場合は、合計文字列の 2 桁目から開始してインデックスを 1 ビット後ろに移動し、ステップ 1 を繰り返します。

この単純なソリューションの欠点は、マッチングが失敗するたびにインデックスが 1 位置だけ戻されるため、冗長な操作が多く効率的ではないことです。

マッチングの最初のラウンド、つまりインデックスが 0 の場合、等しい最初の 4 文字 abcd とマッチングでき、その後、目的の g# が見つかります。 ## は次と等しい。 実際の e は一致しない。これは、インデックスが 0 の場合にマッチングが失敗したことを示しており、インデックス 1 から調べ始めますが、最初の 4 文字の出現はすでにわかっているためです。最初の照合ラウンドでは合計文字列ですが、それでも 1 つずつ繰り返し照合する必要があります。

部分一致テーブル/部分一致テーブル

長さ 8

abababca の文字列を例として、部分一致テーブルは次のとおりです。

<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">char:  | a | b | a | b | a | b | c | a |<br>index: | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | <br>value: | 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 |</span>
ログイン後にコピー
ログイン後にコピー

value 行は、部分一致テーブルの値です。

サブセット

上記の例の文字列の場合、

index が 2 である位置を観察すると、サブセット aba が得られます。 index が 7 である位置を観察すると、文字列全体を取得していることは明らかです。観察する位置が異なる場合は、部分文字列が変更されているため、注目している文字列の部分集合が異なることを意味します。

プレフィックスとサフィックス

指定された文字列の末尾から 1 つ以上の文字を削除し、残りの部分を文字列プレフィックス (適切な) の真の値と呼びます。プレフィックス)、以下プレフィックスと呼びます。ここでの「真」は「真の接頭辞」を意味するものではなく、数学における集合の「適切な部分集合」を考えてください。たとえば、

banana、そのプレフィックスは次のとおりです:

  • b<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>
  • ba<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"> </span>
  • #バン<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>
  • バナ<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>
  • banan<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>
  • #同様に、ヘッダーから始めて 1 つ以上の単語を削除し、残りの部分が文字列の真の接尾辞 (適切な接尾辞) になります。または
banana

、そのサフィックスは: <ul> <li><code style="white-space: nowrap;"><span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">アナ</span>

  • ##ナナ<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>
  • #アナ<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>
  • <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>
  • ##a
  • <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"></span>##部分一致値
  • すべてのプレフィックスとサフィックスが数量的に対称であることがわかります。次に、プレフィックスから 1 つを見つけて、それをサフィックスと照合します。この試合の意味。最初のテキスト abababca を例として取り上げます。

    index が 2 である位置を観察すると、部分文字列は

    aba

    で、その接尾辞と接尾辞は次のようになります。 プレフィックス: a

      ab
    • サフィックス: ba
    • a
    • ## プレフィックスを順番に変更します接尾辞が一致します。ここで接尾辞リストで一致できる部分文字列は a だけです。長さは 1 なので、観測結果を表に記入して書き留めます。一致する表は一致します。
    別の例として、

    index が 3 である位置を観察してみましょう。このとき得られる部分文字列は abab

    であり、このときのサフィックスとサフィックスは次のとおりです。

    プレフィックス: a

    ab
    • aba サフィックス: babab
    • ,
    • bこの時点で、一致する項目は ab で、長さは 2 であることがわかります。は、上記の部分一致テーブルの値とも一致します。
    別の例として、

    index が 5 である位置を観察してみましょう。このとき、部分文字列は ababab

    で、サフィックスとサフィックスは次のとおりです。

    プレフィックス : aab

      aba
    • ababababa サフィックス: babababab
    • bab
    • abb# # その後、それぞれのプレフィックスを取得します。要素はサフィックス内の要素と照合され、最終的に 2 つの一致が見つかります。 #abab

    長い方の
      abab
    • を使用し、その長さは 4 です。 <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">それでは、上の部分一致テーブルを見てみましょう。まず、その値がどのように由来するかを理解でき、次に、その表現の意味、つまり、すべての一致の中で最も長い長さを理解できます。プレフィックスとサフィックスの長さ。 </span>
    • index
    • が 6 になるまで続けると、部分文字列は abababc<span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"> となり、予想のとおり、接尾辞と接尾辞に一致するものは見つかりません。すべてのプレフィックスに </span>c が含まれるわけではなく、すべてのサフィックスに
    • c
    が含まれるためです。したがって、この時点では部分一致値は 0 になります。

    続行すると、文字列の終わり、つまり文字列 abababca

    全体に到達します。また、すべてのプレフィックスが

    a

    で始まり、すべてのサフィックスが

    a で終わるため、この場合の部分一致値は少なくとも 1 であることが予想されます。次のサフィックスには c が追加され始めているため、すべてのサフィックスには ca が含まれており、c を含むことができる唯一のプレフィックスは であることがわかります。 abababc

    、長さ 7 は、同じ長さのサフィックス

    bababca と一致しません。この時点で、一致結果は 1 であり、もう一致はないと結論付けることができます。 部分一致テーブルの使用上記の部分一致値を使用すると、文字列検索を実行するときに、失敗するたびに 1 ビットだけを移動する必要がなくなります。ただし、複数のビットを移動して、冗長な一致を削除することができます。ここには次のような式があります: 長さpartial_match_lengthの部分一致が見つかり、table[partial_match_length] > 1の場合、partial_match_length - table[partial_match_length - 1]をスキップできます。文字。#

    如果匹配过程中,匹配到了部分值为 partial_match_length,即目前找出前 partial_match_length 个字符是匹配的,将这个长度减一作为部分匹配表格中的 index 代入,查找其对应的 valuetable[partial_match_length-1],那么我们可以向前移动的步长为 partial_match_length - table[partial_match_length - 1]

    下面是本文开始时的那个部分匹配表:

    <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">char:  | a | b | a | b | a | b | c | a |<br>index: | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | <br>value: | 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 |</span>
    ログイン後にコピー
    ログイン後にコピー

    假设需要从 bacbababaabcbab 中查找 abababca,根据上面的公式我们来走一遍。

    首次匹配发生在总字符串的第二个字符,

    <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">bacbababaabcbab |<br> abababca</span>
    ログイン後にコピー

    此时匹配的长度为 1,部分匹配表中索引为 1-1=0 的位置对应的部分匹配值为 0,所以我们可以向前移动的距离是 1-0 1。其实也相当于没有跳跃,就是正常的本次匹配失败,索引后移一位的情况。这里没有节省任何成本。

    继续直到再次发生匹配,此时匹配到的情况如下:

    <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">bacbababaabcbab    |||||<br>    abababca</span>
    ログイン後にコピー

    现在匹配到的长度是 5,部分匹配表中 5-1=4 对应的部分匹配值为 3,所以我们可以向前移动 5-3=2,此时一下子就可以移动两位了。

    <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">    上一次的位置    | 最新移动到的位置    | |bacbababaabcbab<br>    xx|||<br>      abababca</span>
    ログイン後にコピー

    此时匹配到的长度为 3, 查找到 table[partial_match_length-1] 即 index 为 2 对应的值为 1,所以可向前移动的距离为 

    3-1=2。

    <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">bacbababaabcbab<br>      xx|<br>        abababca</span>
    ログイン後にコピー

    此时我们需要查找的字符串其长度已经超出剩余可用来匹配的字符串了,所以可直接结束匹配,得到结论:没有查找到结果。

    Javascript 中的实现

    以下是来自 trekhleb/javascript-algorithms 中 JavaScript 版本的 KMP 算法实现:

    相关教程:Javascript视频教程

    <span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">//**<br/> * @see https://www.youtube.com/watch?v=GTJr8OvyEVQ<br/> * @param {string} word<br/> * @return {number[]}<br/> */<br/>function buildPatternTable(word) {<br/>  const patternTable = [0];<br/>  let prefixIndex = 0;<br/>  let suffixIndex = 1;<br/><br/>  while (suffixIndex < word.length) {<br/>    if (word[prefixIndex] === word[suffixIndex]) {<br/>      patternTable[suffixIndex] = prefixIndex + 1;<br/>      suffixIndex += 1;<br/>      prefixIndex += 1;<br/>    } else if (prefixIndex === 0) {<br/>      patternTable[suffixIndex] = 0;<br/>      suffixIndex += 1;</span><span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"><br/></span><span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif">    } else {<br/>      prefixIndex = patternTable[prefixIndex - 1];<br/>    }<br/>  }<br/><br/>  return patternTable;<br/>}<br/><br/>/**<br/> * @param {string} text<br/> * @param {string} word<br/> * @return {number}<br/> */<br/>export default function knuthMorrisPratt(text, word) {<br/>  if (word.length === 0) {<br/>    return 0;</span><span style="font-family:Microsoft Yahei, Hiragino Sans GB, Helvetica, Helvetica Neue, 微软雅黑, Tahoma, Arial, sans-serif"><br/>  }<br/><br/>  let textIndex = 0;<br/>  let wordIndex = 0;<br/><br/>  const patternTable = buildPatternTable(word);<br/><br/>  while (textIndex < text.length) {<br/>    if (text[textIndex] === word[wordIndex]) {<br/>      // We&#39;ve found a match.<br/>      if (wordIndex === word.length - 1) {<br/>        return (textIndex - word.length) + 1;<br/>      }<br/>      wordIndex += 1;<br/>      textIndex += 1;<br/>    } else if (wordIndex > 0) {<br/>      wordIndex = patternTable[wordIndex - 1];<br/>    } else {<br/>      wordIndex = 0;<br/>      textIndex += 1;<br/>    }<br/>  }<br/><br/>  return -1;<br/>}<br/></span>
    ログイン後にコピー

    时间复杂度

    因为算法中涉及两部分字符串的线性对比,其时间复杂度为两字符串长度之和,假设需要搜索的关键词长度为 k,总字符串长度为 m,则时间复杂度为 O(k+m)。

    以上がKMPアルゴリズムを簡単に理解できるようにするの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

    このウェブサイトの声明
    この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

    ホットAIツール

    Undresser.AI Undress

    Undresser.AI Undress

    リアルなヌード写真を作成する AI 搭載アプリ

    AI Clothes Remover

    AI Clothes Remover

    写真から衣服を削除するオンライン AI ツール。

    Undress AI Tool

    Undress AI Tool

    脱衣画像を無料で

    Clothoff.io

    Clothoff.io

    AI衣類リムーバー

    Video Face Swap

    Video Face Swap

    完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

    ホットツール

    メモ帳++7.3.1

    メモ帳++7.3.1

    使いやすく無料のコードエディター

    SublimeText3 中国語版

    SublimeText3 中国語版

    中国語版、とても使いやすい

    ゼンドスタジオ 13.0.1

    ゼンドスタジオ 13.0.1

    強力な PHP 統合開発環境

    ドリームウィーバー CS6

    ドリームウィーバー CS6

    ビジュアル Web 開発ツール

    SublimeText3 Mac版

    SublimeText3 Mac版

    神レベルのコード編集ソフト(SublimeText3)

    CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 Mar 26, 2024 pm 12:41 PM

    上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

    推奨: 優れた JS オープンソースの顔検出および認識プロジェクト 推奨: 優れた JS オープンソースの顔検出および認識プロジェクト Apr 03, 2024 am 11:55 AM

    顔の検出および認識テクノロジーは、すでに比較的成熟しており、広く使用されているテクノロジーです。現在、最も広く使用されているインターネット アプリケーション言語は JS ですが、Web フロントエンドでの顔検出と認識の実装には、バックエンドの顔認識と比較して利点と欠点があります。利点としては、ネットワーク インタラクションの削減とリアルタイム認識により、ユーザーの待ち時間が大幅に短縮され、ユーザー エクスペリエンスが向上することが挙げられます。欠点としては、モデル サイズによって制限されるため、精度も制限されることが挙げられます。 js を使用して Web 上に顔検出を実装するにはどうすればよいですか? Web 上で顔認識を実装するには、JavaScript、HTML、CSS、WebRTC など、関連するプログラミング言語とテクノロジに精通している必要があります。同時に、関連するコンピューター ビジョンと人工知能テクノロジーを習得する必要もあります。 Web 側の設計により、次の点に注意してください。

    C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

    C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

    C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる Apr 02, 2024 pm 05:36 PM

    C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

    人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる 人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる Mar 22, 2024 pm 10:10 PM

    人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

    改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 Jun 06, 2024 pm 12:33 PM

    01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

    58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

    1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

    jsとvueの関係 jsとvueの関係 Mar 11, 2024 pm 05:21 PM

    js と vue の関係: 1. Web 開発の基礎としての JS、2. フロントエンド フレームワークとしての Vue.js の台頭、3. JS と Vue の補完関係、4. JS と Vue の実用化ビュー。

    See all articles