Heim Backend-Entwicklung C++ Verwenden einer Hash-Tabelle zum Implementieren der Zeichenfolgensuche in C++

Verwenden einer Hash-Tabelle zum Implementieren der Zeichenfolgensuche in C++

Aug 22, 2023 pm 12:03 PM
c++ 查找 哈希表

Verwenden einer Hash-Tabelle zum Implementieren der Zeichenfolgensuche in C++

Hash-Tabelle ist eine sehr verbreitete Datenstruktur, die Schlüsselwerte einer Tabelle fester Größe zuordnet und so effiziente Such-, Einfüge- und Löschvorgänge ermöglicht. In C++ können wir unordered_map in STL (Standard Template Library) verwenden, um eine Hash-Tabelle zu implementieren.

In praktischen Anwendungen ist es häufig erforderlich, Suchvorgänge für Zeichenfolgen durchzuführen. Ermitteln Sie beispielsweise die Häufigkeit des Vorkommens eines bestimmten Schlüsselworts in einem Text oder alle Zeilen, die eine bestimmte Zeichenfolge enthalten. Um diese Aufgaben effizient zu erledigen, können String-Suchen mithilfe von Hash-Tabellen implementiert werden.

In diesem Artikel stellen wir die spezifische Methode zur Verwendung einer Hash-Tabelle zur Implementierung der Zeichenfolgensuche in C++ vor. Als Beispiel verwenden wir die Ermittlung der Häufigkeit, mit der eine Zeichenfolge in einem Text vorkommt.

Zuerst müssen wir eine Funktion definieren, um Zeichenfolgen einer Hash-Tabelle zuzuordnen. Eine gängige Methode besteht darin, den Hashwert einer Zeichenfolge als Schlüsselwert zu verwenden und so sicherzustellen, dass unterschiedliche Zeichenfolgen unterschiedlichen Orten zugeordnet werden. Damit eine Hash-Funktion eine gute Leistung erbringt, muss sie schnell berechnet werden und das Auftreten von Hash-Konflikten sollte minimiert werden.

Hier ist eine einfache Hash-Funktionsimplementierung, die die ASCII-Codes der Zeichenfolgen hinzufügt und den Rest übernimmt:

size_t hash_func(const std::string& str) {
    size_t hash_val = 0;
    for (char c : str) {
        hash_val += static_cast<size_t>(c);
    }
    return hash_val % MAP_SIZE;
}
Nach dem Login kopieren

Als nächstes müssen wir jedes Wort im Text in die Hash-Tabelle einfügen. Wir können den Text in eine Hash-Tabelle einfügen, indem wir ihn durch Leerzeichen in Wörter aufteilen und eine Hash-Funktion aufrufen. Da ein Schlüsselwort mehrmals vorkommen kann, müssen wir aufzeichnen, wie oft jedes Schlüsselwort vorkommt. Wir können unordered_map verwenden, um diese Funktion zu erreichen. Wenn der Schlüsselwert beim Einfügen bereits vorhanden ist, wird der Wert erhöht:

std::unordered_map<std::string, size_t> word_map;
for (std::string word : words) {
    if (word_map.find(word) == word_map.end()) {
        word_map[word] = 1;
    } else {
        ++word_map[word];
    }
}
Nach dem Login kopieren

Schließlich können wir sein Vorkommen im Text ermitteln, indem wir den Wert aufrufen, der der Zeichenfolge in der Hash-Tabelle entspricht. Die Häufigkeit:

size_t count = word_map["target_string"];
Nach dem Login kopieren

Der vollständige Code lautet wie folgt:

#include 
#include 
#include 
#include 

const size_t MAP_SIZE = 1024;

size_t hash_func(const std::string& str) {
    size_t hash_val = 0;
    for (char c : str) {
        hash_val += static_cast<size_t>(c);
    }
    return hash_val % MAP_SIZE;
}

int main() {
    std::vector words {"hello", "world", "hello", "c++", "hash", "world", "world"};
    std::unordered_map word_map;

    for (std::string word : words) {
        if (word_map.find(word) == word_map.end()) {
            word_map[word] = 1;
        } else {
            ++word_map[word];
        }
    }

    size_t count = word_map["world"];
    std::cout << "The word 'world' appears " << count << " times." << std::endl;

    return 0;
}
Nach dem Login kopieren

Mit dem obigen Code können wir eine Hash-Tabelle verwenden, um schnell zu zählen, wie oft eine Zeichenfolge in einem Text vorkommt. Die Verwendung von Hash-Tabellen kann die Suchleistung verbessern, was bei großen Datenmengen offensichtlicher ist. Außerdem bietet sie eine große Flexibilität und Skalierbarkeit in praktischen Anwendungen.

Das obige ist der detaillierte Inhalt vonVerwenden einer Hash-Tabelle zum Implementieren der Zeichenfolgensuche in C++. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Was ist die Rolle von CHAR in C -Saiten? Was ist die Rolle von CHAR in C -Saiten? Apr 03, 2025 pm 03:15 PM

In C wird der Zeichenentyp in Saiten verwendet: 1. Speichern Sie ein einzelnes Zeichen; 2. Verwenden Sie ein Array, um eine Zeichenfolge darzustellen und mit einem Null -Terminator zu enden. 3. Durch eine Saitenbetriebsfunktion arbeiten; 4. Lesen oder geben Sie eine Zeichenfolge von der Tastatur aus.

Vier Möglichkeiten zur Implementierung von Multithreading in C -Sprache Vier Möglichkeiten zur Implementierung von Multithreading in C -Sprache Apr 03, 2025 pm 03:00 PM

Multithreading in der Sprache kann die Programmeffizienz erheblich verbessern. Es gibt vier Hauptmethoden, um Multithreading in C -Sprache zu implementieren: Erstellen Sie unabhängige Prozesse: Erstellen Sie mehrere unabhängig laufende Prozesse. Jeder Prozess hat seinen eigenen Speicherplatz. Pseudo-MultitHhreading: Erstellen Sie mehrere Ausführungsströme in einem Prozess, der denselben Speicherplatz freigibt und abwechselnd ausführt. Multi-Thread-Bibliothek: Verwenden Sie Multi-Thread-Bibliotheken wie PThreads, um Threads zu erstellen und zu verwalten, wodurch reichhaltige Funktionen der Thread-Betriebsfunktionen bereitgestellt werden. Coroutine: Eine leichte Multi-Thread-Implementierung, die Aufgaben in kleine Unteraufgaben unterteilt und sie wiederum ausführt.

Berechnung des C-Subscript 3-Index 5 C-Subscript 3-Index 5-Algorithmus-Tutorial Berechnung des C-Subscript 3-Index 5 C-Subscript 3-Index 5-Algorithmus-Tutorial Apr 03, 2025 pm 10:33 PM

Die Berechnung von C35 ist im Wesentlichen kombinatorische Mathematik, die die Anzahl der aus 3 von 5 Elementen ausgewählten Kombinationen darstellt. Die Berechnungsformel lautet C53 = 5! / (3! * 2!), Was direkt durch Schleifen berechnet werden kann, um die Effizienz zu verbessern und Überlauf zu vermeiden. Darüber hinaus ist das Verständnis der Art von Kombinationen und Beherrschen effizienter Berechnungsmethoden von entscheidender Bedeutung, um viele Probleme in den Bereichen Wahrscheinlichkeitsstatistik, Kryptographie, Algorithmus -Design usw. zu lösen.

Unterschiedliche Funktionsnutzungsabstand Funktion C -Verwendung Tutorial Unterschiedliche Funktionsnutzungsabstand Funktion C -Verwendung Tutorial Apr 03, 2025 pm 10:27 PM

STD :: Einzigartige Entfernung benachbarte doppelte Elemente im Container und bewegt sie bis zum Ende, wodurch ein Iterator auf das erste doppelte Element zeigt. STD :: Distanz berechnet den Abstand zwischen zwei Iteratoren, dh die Anzahl der Elemente, auf die sie hinweisen. Diese beiden Funktionen sind nützlich, um den Code zu optimieren und die Effizienz zu verbessern, aber es gibt auch einige Fallstricke, auf die geachtet werden muss, wie z. STD :: Distanz ist im Umgang mit nicht randomischen Zugriffs-Iteratoren weniger effizient. Indem Sie diese Funktionen und Best Practices beherrschen, können Sie die Leistung dieser beiden Funktionen voll ausnutzen.

Wie kann ich die Schlangennomenklatur in der C -Sprache anwenden? Wie kann ich die Schlangennomenklatur in der C -Sprache anwenden? Apr 03, 2025 pm 01:03 PM

In der C -Sprache ist die Snake -Nomenklatur eine Konvention zum Codierungsstil, bei der Unterstriche zum Verbinden mehrerer Wörter mit Variablennamen oder Funktionsnamen angeschlossen werden, um die Lesbarkeit zu verbessern. Obwohl es die Zusammenstellung und den Betrieb nicht beeinträchtigen wird, müssen langwierige Benennung, IDE -Unterstützung und historisches Gepäck berücksichtigt werden.

Verwendung von Veröffentlichungen in C. Verwendung von Veröffentlichungen in C. Apr 04, 2025 am 07:54 AM

Die Funktion Release_Semaphor in C wird verwendet, um das erhaltene Semaphor zu freigeben, damit andere Threads oder Prozesse auf gemeinsame Ressourcen zugreifen können. Es erhöht die Semaphorzahl um 1 und ermöglicht es dem Blockierfaden, die Ausführung fortzusetzen.

Probleme mit der Dev-C-Version Probleme mit der Dev-C-Version Apr 03, 2025 pm 07:33 PM

DEV-C 4.9.9.2 Kompilierungsfehler und -lösungen Wenn das Kompilieren von Programmen in Windows 11-System mit Dev-C 4.9.9.2 kompiliert wird, kann der Compiler-Datensatz die folgende Fehlermeldung anzeigen: GCC.EXE: INTERNEHERERROR: ABTREIDED (programmcollect2) pleasSubMitAfulbugrort.SeeforinSructions. Obwohl die endgültige "Kompilierung erfolgreich ist", kann das tatsächliche Programm nicht ausgeführt werden und eine Fehlermeldung "Original -Code -Archiv kann nicht kompiliert werden" auftauchen. Dies liegt normalerweise daran, dass der Linker sammelt

C- und Systemprogrammierung: Steuerung und Hardware-Interaktion mit niedriger Ebene C- und Systemprogrammierung: Steuerung und Hardware-Interaktion mit niedriger Ebene Apr 06, 2025 am 12:06 AM

C eignet sich für die Systemprogrammierung und Hardware-Interaktion, da es Steuerfunktionen in der Nähe von Hardware und leistungsstarke Funktionen der objektorientierten Programmierung bietet. 1) C über Merkmale auf niedrigem Niveau wie Zeiger, Speicherverwaltung und Bitbetrieb können effizienter Betrieb auf Systemebene erreicht werden. 2) Die Hardware -Interaktion wird über Geräte -Treiber implementiert, und C kann diese Treiber so schreiben, dass sie mit Hardware -Geräten über die Kommunikation umgehen.

See all articles