Rumah pembangunan bahagian belakang C++ Menggunakan jadual hash untuk melaksanakan carian rentetan dalam C++

Menggunakan jadual hash untuk melaksanakan carian rentetan dalam C++

Aug 22, 2023 pm 12:03 PM
c++ Cari Hash jadual

Menggunakan jadual hash untuk melaksanakan carian rentetan dalam C++

Jadual cincang ialah struktur data yang sangat biasa yang memetakan nilai utama ke dalam jadual bersaiz tetap, membolehkan operasi carian, sisipan dan pemadaman yang cekap. Dalam C++, kita boleh menggunakan unordered_map dalam STL (Perpustakaan Templat Standard) untuk melaksanakan jadual cincang.

Dalam aplikasi praktikal, selalunya perlu melakukan operasi carian pada rentetan. Sebagai contoh, cari bilangan kejadian kata kunci tertentu dalam teks atau cari semua baris yang mengandungi rentetan tertentu. Untuk melaksanakan tugas ini dengan cekap, carian rentetan boleh dilaksanakan menggunakan jadual cincang.

Dalam artikel ini, kami akan memperkenalkan kaedah khusus menggunakan jadual cincang untuk melaksanakan carian rentetan dalam C++. Kami akan menggunakan contoh mencari bilangan kali rentetan muncul dalam teks.

Pertama, kita perlu mentakrifkan fungsi untuk memetakan rentetan ke dalam jadual cincang. Kaedah biasa ialah menggunakan nilai cincang rentetan sebagai nilai utama, dengan itu memastikan rentetan yang berbeza dipetakan ke lokasi yang berbeza. Untuk membolehkan fungsi cincang mempunyai prestasi yang baik, ia perlu dikira dengan cepat dan kejadian konflik cincang harus diminimumkan.

Berikut ialah pelaksanaan fungsi cincang mudah yang menambahkan kod ASCII rentetan dan mengambil baki:

size_t hash_func(const std::string& str) {
    size_t hash_val = 0;
    for (char c : str) {
        hash_val += static_cast<size_t>(c);
    }
    return hash_val % MAP_SIZE;
}
Salin selepas log masuk

Seterusnya, kita perlu memasukkan setiap perkataan dalam teks ke dalam jadual cincang. Kita boleh memasukkan teks ke dalam jadual cincang dengan membahagikannya kepada perkataan mengikut ruang dan memanggil fungsi cincang. Memandangkan kata kunci mungkin muncul beberapa kali, kami perlu merekodkan bilangan kali setiap kata kunci muncul. Kita boleh menggunakan unordered_map untuk mencapai fungsi ini Jika nilai kunci sudah wujud semasa sisipan, nilai akan ditambah:

std::unordered_map<std::string, size_t> word_map;
for (std::string word : words) {
    if (word_map.find(word) == word_map.end()) {
        word_map[word] = 1;
    } else {
        ++word_map[word];
    }
}
Salin selepas log masuk

Akhirnya, kita boleh mendapatkan kejadiannya dalam teks dengan memanggil nilai yang sepadan dengan rentetan dalam jadual cincang. Bilangan kali:

size_t count = word_map["target_string"];
Salin selepas log masuk

Kod lengkap adalah seperti berikut:

#include 
#include 
#include 
#include 

const size_t MAP_SIZE = 1024;

size_t hash_func(const std::string& str) {
    size_t hash_val = 0;
    for (char c : str) {
        hash_val += static_cast<size_t>(c);
    }
    return hash_val % MAP_SIZE;
}

int main() {
    std::vector words {"hello", "world", "hello", "c++", "hash", "world", "world"};
    std::unordered_map word_map;

    for (std::string word : words) {
        if (word_map.find(word) == word_map.end()) {
            word_map[word] = 1;
        } else {
            ++word_map[word];
        }
    }

    size_t count = word_map["world"];
    std::cout << "The word 'world' appears " << count << " times." << std::endl;

    return 0;
}
Salin selepas log masuk

Dengan kod di atas, kita boleh menggunakan jadual cincang untuk mengira dengan cepat bilangan kali rentetan muncul dalam teks. Penggunaan jadual cincang boleh meningkatkan prestasi carian, yang lebih jelas untuk jumlah data yang besar. Ia juga mempunyai fleksibiliti dan kebolehskalaan yang hebat dalam aplikasi praktikal.

Atas ialah kandungan terperinci Menggunakan jadual hash untuk melaksanakan carian rentetan dalam C++. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apakah peranan char dalam c strings Apakah peranan char dalam c strings Apr 03, 2025 pm 03:15 PM

Dalam C, jenis char digunakan dalam rentetan: 1. Simpan satu watak; 2. Gunakan array untuk mewakili rentetan dan berakhir dengan terminator null; 3. Beroperasi melalui fungsi operasi rentetan; 4. Baca atau output rentetan dari papan kekunci.

Empat cara untuk melaksanakan multithreading dalam bahasa c Empat cara untuk melaksanakan multithreading dalam bahasa c Apr 03, 2025 pm 03:00 PM

Multithreading dalam bahasa dapat meningkatkan kecekapan program. Terdapat empat cara utama untuk melaksanakan multithreading dalam bahasa C: Buat proses bebas: Buat pelbagai proses berjalan secara bebas, setiap proses mempunyai ruang ingatan sendiri. Pseudo-Multithreading: Buat pelbagai aliran pelaksanaan dalam proses yang berkongsi ruang memori yang sama dan laksanakan secara bergantian. Perpustakaan multi-threaded: Gunakan perpustakaan berbilang threaded seperti PTHREADS untuk membuat dan mengurus benang, menyediakan fungsi operasi benang yang kaya. Coroutine: Pelaksanaan pelbagai threaded ringan yang membahagikan tugas menjadi subtask kecil dan melaksanakannya pada gilirannya.

Cara Mengira C-SubScript 3 Subscript 5 C-SubScript 3 Subscript 5 Algoritma Tutorial Cara Mengira C-SubScript 3 Subscript 5 C-SubScript 3 Subscript 5 Algoritma Tutorial Apr 03, 2025 pm 10:33 PM

Pengiraan C35 pada dasarnya adalah matematik gabungan, yang mewakili bilangan kombinasi yang dipilih dari 3 dari 5 elemen. Formula pengiraan ialah C53 = 5! / (3! * 2!), Yang boleh dikira secara langsung oleh gelung untuk meningkatkan kecekapan dan mengelakkan limpahan. Di samping itu, memahami sifat kombinasi dan menguasai kaedah pengiraan yang cekap adalah penting untuk menyelesaikan banyak masalah dalam bidang statistik kebarangkalian, kriptografi, reka bentuk algoritma, dll.

Fungsi Penggunaan Fungsi Jarak Jarak Jarak Penggunaan C Tutorial Penggunaan Fungsi Penggunaan Fungsi Jarak Jarak Jarak Penggunaan C Tutorial Penggunaan Apr 03, 2025 pm 10:27 PM

STD :: Unik menghilangkan elemen pendua bersebelahan di dalam bekas dan menggerakkannya ke akhir, mengembalikan iterator yang menunjuk ke elemen pendua pertama. STD :: Jarak mengira jarak antara dua iterators, iaitu bilangan elemen yang mereka maksudkan. Kedua -dua fungsi ini berguna untuk mengoptimumkan kod dan meningkatkan kecekapan, tetapi terdapat juga beberapa perangkap yang perlu diberi perhatian, seperti: STD :: Unik hanya berkaitan dengan unsur -unsur pendua yang bersebelahan. STD :: Jarak kurang cekap apabila berurusan dengan Iterator Akses Bukan Rawak. Dengan menguasai ciri -ciri dan amalan terbaik ini, anda boleh menggunakan sepenuhnya kuasa kedua -dua fungsi ini.

Penggunaan Releaseemaphore dalam C Penggunaan Releaseemaphore dalam C Apr 04, 2025 am 07:54 AM

Fungsi Release_semaphore dalam C digunakan untuk melepaskan semaphore yang diperoleh supaya benang atau proses lain dapat mengakses sumber yang dikongsi. Ia meningkatkan kiraan semaphore dengan 1, yang membolehkan benang menyekat untuk meneruskan pelaksanaan.

Bagaimana cara menggunakan nomenclature ular dalam bahasa c? Bagaimana cara menggunakan nomenclature ular dalam bahasa c? Apr 03, 2025 pm 01:03 PM

Dalam bahasa C, nomenclature ular adalah konvensyen gaya pengekodan, yang menggunakan garis bawah untuk menyambungkan beberapa perkataan untuk membentuk nama pembolehubah atau nama fungsi untuk meningkatkan kebolehbacaan. Walaupun ia tidak akan menjejaskan kompilasi dan operasi, penamaan panjang, isu sokongan IDE, dan bagasi sejarah perlu dipertimbangkan.

Masalah dengan versi dev-c Masalah dengan versi dev-c Apr 03, 2025 pm 07:33 PM

DEV-C 4.9.9.2 Kesilapan dan Penyelesaian Penyusunan Apabila menyusun program dalam sistem Windows 11 menggunakan dev-C 4.9.9.2, panel rekod pengkompil boleh memaparkan mesej ralat berikut: gcc.exe: internalerror: dibatalkan (programcollect2) PleaseSubmitafullbugreport.seeforinstructions. Walaupun "kompilasi berjaya", program sebenar tidak dapat dijalankan dan mesej ralat "Arkib kod asal tidak dapat disusun" muncul. Ini biasanya kerana penghubung mengumpul

C dan Pengaturcaraan Sistem: Kawalan Rendah dan Interaksi Perkakasan C dan Pengaturcaraan Sistem: Kawalan Rendah dan Interaksi Perkakasan Apr 06, 2025 am 12:06 AM

C sesuai untuk pengaturcaraan sistem dan interaksi perkakasan kerana ia menyediakan keupayaan kawalan dekat dengan perkakasan dan ciri-ciri kuat pengaturcaraan berorientasikan objek. 1) C melalui ciri-ciri peringkat rendah seperti penunjuk, pengurusan memori dan operasi bit, operasi peringkat sistem yang cekap dapat dicapai. 2) Interaksi perkakasan dilaksanakan melalui pemacu peranti, dan C boleh menulis pemandu ini untuk mengendalikan komunikasi dengan peranti perkakasan.

See all articles