Rumah pangkalan data tutorial mysql Mysql 索引的基础(下)_MySQL

Mysql 索引的基础(下)_MySQL

May 30, 2016 pm 05:10 PM
Pangkalan indeks

如果需要存储大量的URL并需要根据URL进行搜索查找。如果使用B-Tree 来存储URL,存储的内容就会很大,因为URL本身都很长。正常情况下会有如下查询:

 

SELECT id FROM url WHERE url="http://www.baidu.com";

 

若删除原来URL上的索引,而新增一个被索引的url_crc列,使用CRC32做hash ,就可以用下面的方式查询:

 

SELECT id FROM url WHERE url='http://www.baidu.com' AND rul_crc=CRC32('http://www.baidu.com');

 

这样做性能非常高,因为MySQL 优化器会使用这个选择性很高而体积很小的基于url_crc列的索引来完成查找。即使有多个相同的索引值,查找任然很快,只需要根据hash值做快速的整数比较就能找到索引条目,然后一一返回对应的行。另外一种方式就是对完整的URL字符串做索引,那样会非常慢。

 

这样实现的缺陷是需要维护hash值。可以手动维护,可以触发器实现。如果采用这种方式,记住,不要使用SHA1()和MD5()作为哈希函数。因为这两个函数计算出来的hash值时非常长的字符串,会浪费更大的空间,比较时也会更慢。SHA1()和MD5()是强加密函数,设计目标是最大限度的消除冲突,蛋这里并不需要这样搞的要求。简单hash函数的冲突在一个可以接受的范围,同事有能提供更好的性能。

 

如果数据表非常大,CRC32()会出现大量的hash冲突,则可以考虑自己实现一个简单的64位hash函数。这个自定义的函数要返回整数,而不是字符串。一个简单的办法可以使用MD5()函数返回值的一部分来作为自定义hash函数。这肯能比自己写一个hash算法的性能要差,不过这样实现最简单。

 

SELECT CONV(RIGHT(MD5('http://www.baidu.com'),16),16,10) AS HASH64.

 

处理hash冲突。当使用hash索引进行查询的时候,必须在WHERE子句中包含常量值:

 

SELECT id from url WHERE url=crc32('http://www.baidu.com') AND url='http://www.baidu.com';

 

一旦出现hash冲突,另一个字符串的hash值也恰好是相同的,则下面的语句是无法正确工作的:

 

SELECT id from url WHERE url=crc32('http://www.baidu.com');

 

因为所谓的‘生日悖论’ 出现hash冲突的概率的增长率可能比想象的要快的多,CRC32()返回的是32位整数,当索引有9.3W条记录时,出现冲突的概率是1%。例如,我们将'/usr/share/dic/words' 中的词倒数数据表,并进行crc32()计算,最后会有98569行。这就已经出现一次hash冲突了。要避免hash冲突问题,必须在WHERE 条件中带入hahs值和对应的列值。如果不是想查询具体的值,例如只是统计记录数(不精确的),则可以不带入列值,直接使用crc32()的hash值查询即可。还可以使用FNV64()函数作为hash函数,hash值为64位,速度非常快,且冲突比crc32()要少很多。

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apakah jenis indeks Oracle? Apakah jenis indeks Oracle? Nov 16, 2023 am 09:59 AM

Jenis indeks Oracle termasuk: 1. Indeks B-Tree; 3. Indeks fungsi; Indeks sambungan peta bit; 10. Indeks komposit. Pengenalan terperinci: 1. Indeks B-Tree ialah struktur data pokok pengimbangan sendiri yang boleh menyokong operasi serentak dengan cekap Dalam pangkalan data Oracle, indeks B-Tree ialah jenis indeks yang paling biasa digunakan. Indeks Graf Bit adalah berdasarkan jenis indeks pada algoritma bitmap dan sebagainya.

Tutorial Asas PHP: Dari Pemula hingga Master Tutorial Asas PHP: Dari Pemula hingga Master Jun 18, 2023 am 09:43 AM

PHP ialah bahasa skrip sebelah pelayan sumber terbuka yang digunakan secara meluas yang boleh mengendalikan semua tugas dalam pembangunan web. PHP digunakan secara meluas dalam pembangunan web, terutamanya untuk prestasi cemerlangnya dalam pemprosesan data dinamik, jadi ia disukai dan digunakan oleh ramai pembangun. Dalam artikel ini, kami akan menerangkan asas PHP langkah demi langkah untuk membantu pemula daripada mula menjadi mahir. 1. Sintaks asas PHP ialah bahasa yang ditafsirkan yang kodnya serupa dengan HTML, CSS dan JavaScript. Setiap penyata PHP berakhir dengan koma bertitik;

Bagaimana untuk menyelesaikan masalah bahawa indeks melebihi had tatasusunan Bagaimana untuk menyelesaikan masalah bahawa indeks melebihi had tatasusunan Nov 15, 2023 pm 05:22 PM

Penyelesaiannya ialah: 1. Semak sama ada nilai indeks adalah betul: mula-mula sahkan sama ada nilai indeks anda melebihi julat panjang tatasusunan. Indeks tatasusunan bermula dari 0, jadi nilai indeks maksimum hendaklah panjang tatasusunan tolak 1. Semak keadaan sempadan gelung: Jika anda menggunakan indeks untuk akses tatasusunan dalam gelung, pastikan syarat sempadan gelung adalah betul; 3. Mulakan tatasusunan: Sebelum menggunakan tatasusunan, pastikan tatasusunan telah dimulakan dengan betul. dan mengendalikannya dengan sewajarnya.

Bagaimana untuk meningkatkan kecekapan pengumpulan data dan pengagregatan data dalam PHP dan MySQL melalui indeks? Bagaimana untuk meningkatkan kecekapan pengumpulan data dan pengagregatan data dalam PHP dan MySQL melalui indeks? Oct 15, 2023 am 11:39 AM

Bagaimana untuk meningkatkan kecekapan pengumpulan data dan pengagregatan data dalam PHP dan MySQL melalui indeks? Pengenalan: PHP dan MySQL kini merupakan bahasa pengaturcaraan dan sistem pengurusan pangkalan data yang paling banyak digunakan, dan sering digunakan untuk membina aplikasi web dan memproses sejumlah besar data. Pengumpulan data dan pengagregatan data adalah operasi biasa apabila memproses sejumlah besar data, tetapi jika indeks tidak direka bentuk dan digunakan dengan sewajarnya, operasi ini boleh menjadi sangat tidak cekap. Artikel ini akan memperkenalkan cara menggunakan indeks untuk meningkatkan kecekapan pengumpulan data dan pengagregatan data dalam PHP dan MySQL, serta menambah baik

Aplikasi lanjutan penghirisan dan pengindeksan Python: mendedahkan fungsi tersembunyi dan meneroka kemungkinan pengaturcaraan yang tidak terhingga Aplikasi lanjutan penghirisan dan pengindeksan Python: mendedahkan fungsi tersembunyi dan meneroka kemungkinan pengaturcaraan yang tidak terhingga Feb 19, 2024 pm 08:40 PM

Sintaks asas penghirisan dalam Python ialah menggunakan sintaks [start:end:step] untuk operasi penghirisan, dengan permulaan mewakili kedudukan permulaan hirisan, penghujung mewakili kedudukan penghujung hirisan dan langkah mewakili langkah penghirisan. Jika permulaan diabaikan, ini bermakna penghirisan dari permulaan senarai atau rentetan jika penghujung diabaikan, ini bermakna penghirisan ke penghujung senarai atau rentetan, ini bermakna saiz langkah ialah 1. Contohnya: my_list=[1,2,3,4,5]#Potong daripada elemen ke-2 kepada elemen ke-4 (tidak termasuk elemen ke-4) sub_list=my_list[1:4]#[2,3,4 ]#Start dari elemen pertama sehingga akhir senarai sub_li

PHP mengembalikan rentetan dari kedudukan mula ke kedudukan akhir rentetan dalam rentetan lain PHP mengembalikan rentetan dari kedudukan mula ke kedudukan akhir rentetan dalam rentetan lain Mar 21, 2024 am 10:31 AM

Artikel ini akan menerangkan secara terperinci bagaimana PHP mengembalikan rentetan dari kedudukan mula ke kedudukan akhir rentetan dalam rentetan lain Editor berpendapat ia agak praktikal, jadi saya berkongsi dengan anda sebagai rujukan artikel ini. Anda boleh memperoleh sesuatu daripada artikel ini. Gunakan fungsi substr() dalam PHP untuk mengekstrak subrentetan daripada rentetan Fungsi substr() boleh mengekstrak aksara dalam julat tertentu daripada rentetan. Sintaksnya adalah seperti berikut: substr(rentetan,mula,panjang) di mana: rentetan: rentetan asal dari mana subrentetan itu akan diekstrak. mula: Indeks kedudukan permulaan subrentetan (bermula dari 0). panjang (pilihan): Panjang subrentetan. Jika tidak dinyatakan, maka

Program Python untuk memasukkan berbilang elemen ke dalam tatasusunan pada kedudukan indeks yang ditentukan Program Python untuk memasukkan berbilang elemen ke dalam tatasusunan pada kedudukan indeks yang ditentukan Sep 03, 2023 pm 10:13 PM

Tatasusunan ialah koleksi elemen data yang serupa yang disimpan dalam cara yang teratur. Setiap elemen data dalam tatasusunan dikenal pasti dengan nilai indeks. Tatasusunan dalam Python Python tidak mempunyai struktur data tatasusunan asli. Oleh itu, kita boleh menggunakan struktur data senarai dan bukannya tatasusunan. [10,4,11,76,99] Pada masa yang sama, kita boleh menggunakan modul PythonNumpy untuk memproses tatasusunan. Tatasusunan yang ditakrifkan oleh modul numpy ialah −array([1,2,3,4]) Pengindeksan dalam Python bermula dari 0 supaya elemen tatasusunan di atas boleh diakses menggunakan nilai indeks masing-masing seperti 0, 1, 2, hingga n - 1. Dalam artikel berikut, kita akan melihat cara yang berbeza untuk memasukkan berbilang elemen pada indeks yang ditentukan. Masuk dan kalah

Petua dan Soalan Lazim tentang menggunakan indeks unik dalam MySQL Petua dan Soalan Lazim tentang menggunakan indeks unik dalam MySQL Mar 15, 2024 pm 03:09 PM

Petua dan Soalan Lazim untuk menggunakan indeks unik dalam MySQL MySQL ialah sistem pengurusan pangkalan data hubungan yang popular Dalam aplikasi praktikal, indeks unik (uniqueindex) memainkan peranan penting dalam reka bentuk jadual data. Indeks unik boleh memastikan bahawa nilai lajur tertentu dalam jadual adalah unik dan mengelakkan data pendua. Artikel ini akan memperkenalkan kemahiran penggunaan indeks unik dalam MySQL dan jawapan kepada beberapa soalan lazim, dan menyediakan contoh kod khusus untuk membantu pembaca memahami dengan lebih baik. 1.Mencipta

See all articles