Apakah indeks teks penuh mysql-tutorial mysql-php.cn

Jadual Kandungan

Pengenalan

Pengendalian indeks teks penuh

Gunakan indeks teks penuh

Uji indeks teks penuh

两种全文索引

总结

Rumah

pangkalan data

tutorial mysql

Apakah indeks teks penuh mysql

青灯夜游

Apr 23, 2023 pm 07:03 PM

mysql

Dalam mysql, pengindeksan teks penuh ialah teknologi untuk mencari sebarang maklumat dalam keseluruhan buku atau keseluruhan artikel yang disimpan dalam pangkalan data. Kebanyakan pertanyaan yang kami perlukan boleh dilengkapkan melalui perbandingan berangka, penapisan julat, dsb. Walau bagaimanapun, jika anda ingin menapis pertanyaan melalui padanan kata kunci, anda memerlukan pertanyaan berdasarkan persamaan dan bukannya perbandingan angka yang tepat dan Teks Penuh pengindeksan direka untuk senario ini.

Apakah indeks teks penuh mysql

Persekitaran pengendalian tutorial ini: sistem windows7, versi mysql8, komputer Dell G3.

Pengenalan

konsep

Carian Teks Penuh ialah teknologi yang mencari sebarang maklumat dalam keseluruhan buku atau artikel yang disimpan dalam pangkalan data. Ia boleh mendapatkan maklumat tentang bab, bahagian, perenggan, ayat, perkataan, dsb. dalam teks penuh mengikut keperluan, dan juga boleh melakukan pelbagai statistik dan analisis. Pengindeksan teks penuh biasanya dilaksanakan melalui indeks terbalik.

Kebanyakan pertanyaan yang kami perlukan boleh dilengkapkan melalui perbandingan berangka, penapisan julat, dsb. Walau bagaimanapun, jika anda ingin menapis pertanyaan melalui padanan kata kunci, anda perlu membuat pertanyaan berdasarkan persamaan dan bukannya perbandingan berangka tepat asal . Pengindeksan teks penuh direka untuk senario ini.

Anda mungkin berkata, anda boleh menggunakan suka + % untuk mencapai padanan kabur, mengapa anda memerlukan pengindeksan teks penuh? like + % sesuai apabila teks agak kecil, tetapi ia tidak dapat dibayangkan untuk mendapatkan sejumlah besar data teks. Dalam menghadapi sejumlah besar data, pengindeksan teks penuh boleh menjadi N kali lebih pantas daripada seperti + %. Kelajuan bukanlah susunan magnitud, tetapi pengindeksan teks penuh mungkin mempunyai masalah ketepatan.

Anda mungkin tidak memberi perhatian kepada pengindeksan teks penuh, tetapi anda harus biasa dengan sekurang-kurangnya satu teknologi pengindeksan teks penuh: pelbagai enjin carian. Walaupun objek indeks enjin carian adalah jumlah data yang sangat besar, dan biasanya tidak ada pangkalan data hubungan di belakangnya, prinsip asas pengindeksan teks penuh adalah sama.

Sokongan versi

Sebelum kita bermula, mari kita bincangkan tentang versi indeks teks penuh, enjin storan dan sokongan jenis data

Dalam versi sebelum MySQL 5.6, hanya enjin storan MyISAM yang menyokong pengindeksan teks penuh;
Dalam versi MySQL 5.6 dan lebih baru, kedua-dua enjin storan MyISAM dan InnoDB menyokong pengindeksan teks penuh;
Hanya medan Indeks teks penuh boleh dibina hanya jika jenis data ialah char, varchar, teks dan sirinya.

Apabila menguji atau menggunakan indeks teks penuh, anda mesti terlebih dahulu menyemak sama ada versi MySQL, enjin storan dan jenis data anda menyokong indeks teks penuh.

Pengendalian indeks teks penuh

Pengendalian indeks boleh dicari dengan mudah, tetapi saya akan mengulanginya di sini.

Buat

Buat indeks teks penuh apabila mencipta jadual

create table fulltext_test (
    id int(11) NOT NULL AUTO_INCREMENT,
    content text NOT NULL,
    tag varchar(255),    PRIMARY KEY (id),
    FULLTEXT KEY content_tag_fulltext(content,tag)  // 创建联合全文索引列
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

Salin selepas log masuk

Buat indeks teks penuh pada jadual sedia ada

create fulltext index content_tag_fulltext    on fulltext_test(content,tag);

Salin selepas log masuk

Buat indeks teks penuh melalui pernyataan SQL ALTER TABLE

alter table fulltext_test    add fulltext index content_tag_fulltext(content,tag);

Salin selepas log masuk

Ubah suai

Ubah suai dengan O, padamkannya dan bina semula secara langsung.

Padam

Gunakan DROP INDEX terus untuk memadam indeks teks penuh

drop index content_tag_fulltext    on fulltext_test;

Salin selepas log masuk

Padam indeks teks penuh melalui pernyataan SQL ALTER TABLE

alter table fulltext_test    drop index content_tag_fulltext;

Salin selepas log masuk

Gunakan indeks teks penuh

yang adalah berbeza daripada padanan kabur yang biasa digunakan seperti + %, teks penuh Indeks mempunyai format sintaksnya sendiri, menggunakan padanan dan melawan kata kunci, seperti

select * from fulltext_test 
    where match(content,tag) against(&#39;xxx xxx&#39;);

Salin selepas log masuk

Nota: Lajur yang dinyatakan dalam fungsi padanan() mestilah sama seperti yang dinyatakan dalam indeks teks penuh Lajur adalah sama, jika tidak, ralat akan dilaporkan dan indeks teks penuh tidak boleh digunakan Ini kerana indeks teks penuh tidak merekodkan lajur mana kata kunci itu berasal. Jika anda ingin menggunakan indeks teks penuh untuk lajur, buat indeks teks penuh yang berasingan untuk lajur itu.

Uji indeks teks penuh

Tambah data ujian

Ya Dengan pengetahuan di atas, anda boleh menguji indeks teks penuh.

Mula-mula buat jadual ujian dan masukkan data ujian

create table test (
    id int(11) unsigned not null auto_increment,
    content text not null,    primary key(id),
    fulltext key content_index(content)
) engine=MyISAM default charset=utf8;insert into test (content) values (&#39;a&#39;),(&#39;b&#39;),(&#39;c&#39;);insert into test (content) values (&#39;aa&#39;),(&#39;bb&#39;),(&#39;cc&#39;);insert into test (content) values (&#39;aaa&#39;),(&#39;bbb&#39;),(&#39;ccc&#39;);insert into test (content) values (&#39;aaaa&#39;),(&#39;bbbb&#39;),(&#39;cccc&#39;);

Salin selepas log masuk

Laksanakan pertanyaan berikut mengikut sintaks indeks teks penuh

select * from test where match(content) against(&#39;a&#39;);select * from test where match(content) against(&#39;aa&#39;);select * from test where match(content) against(&#39;aaa&#39;);

Salin selepas log masuk

Mengikut inersia kami berfikir, ia sepatutnya dipaparkan 4 rekod adalah betul, tetapi hasilnya ialah tiada 1 rekod Hanya apabila melaksanakan pertanyaan berikut

select * from test where match(content) against(&#39;aaaa&#39;);

Salin selepas log masuk

adakah 1 rekod aaaa akan menjadi. dijumpai.

Kenapa? Terdapat banyak sebab untuk masalah ini, yang paling biasa disebabkan oleh panjang carian minimum. Di samping itu, apabila menggunakan indeks teks penuh, mesti ada sekurang-kurangnya 4 rekod dalam jadual ujian, jika tidak, keputusan yang tidak dijangka akan berlaku.

Indeks teks penuh dalam MySQL mempunyai dua pembolehubah, panjang carian minimum dan panjang carian maksimum Perkataan yang panjangnya kurang daripada panjang carian minimum dan lebih besar daripada panjang carian maksimum tidak akan diindeks. Dalam istilah orang awam, jika anda ingin menggunakan carian indeks teks penuh untuk perkataan, panjang perkataan mestilah dalam julat dua pembolehubah di atas.

Nilai lalai kedua-dua ini boleh dilihat menggunakan arahan berikut

show variables like &#39;%ft%&#39;;

Salin selepas log masuk

可以看到这两个变量在 MyISAM 和 InnoDB 两种存储引擎下的变量名和默认值

// MyISAM
ft_min_word_len = 4;
ft_max_word_len = 84;

// InnoDB
innodb_ft_min_token_size = 3;
innodb_ft_max_token_size = 84;

Salin selepas log masuk

可以看到最小搜索长度 MyISAM 引擎下默认是 4，InnoDB 引擎下是 3，也即，MySQL 的全文索引只会对长度大于等于 4 或者 3 的词语建立索引，而刚刚搜索的只有 aaaa 的长度大于等于 4。

配置最小搜索长度

全文索引的相关参数都无法进行动态修改，必须通过修改 MySQL 的配置文件来完成。修改最小搜索长度的值为 1，首先打开 MySQL 的配置文件 /etc/my.cnf，在 [mysqld] 的下面追加以下内容

[mysqld]innodb_ft_min_token_size = 1ft_min_word_len = 1

Salin selepas log masuk

然后重启 MySQL 服务器，并修复全文索引。注意，修改完参数以后，一定要修复下索引，不然参数不会生效。

两种修复方式，可以使用下面的命令修复

repair table test quick;

Salin selepas log masuk

或者直接删掉重新建立索引，再次执行上面的查询，a、aa、aaa 就都可以查出来了。

但是，这里还有一个问题，搜索关键字 a 时，为什么 aa、aaa、aaaa 没有出现结果中，讲这个问题之前，先说说两种全文索引。

两种全文索引

自然语言的全文索引

默认情况下，或者使用 in natural language mode 修饰符时，match() 函数对文本集合执行自然语言搜索，上面的例子都是自然语言的全文索引。

自然语言搜索引擎将计算每一个文档对象和查询的相关度。这里，相关度是基于匹配的关键词的个数，以及关键词在文档中出现的次数。在整个索引中出现次数越少的词语，匹配时的相关度就越高。相反，非常常见的单词将不会被搜索，如果一个词语的在超过 50% 的记录中都出现了，那么自然语言的搜索将不会搜索这类词语。上面提到的，测试表中必须有 4 条以上的记录，就是这个原因。

这个机制也比较好理解，比如说，一个数据表存储的是一篇篇的文章，文章中的常见词、语气词等等，出现的肯定比较多，搜索这些词语就没什么意义了，需要搜索的是那些文章中有特殊意义的词，这样才能把文章区分开。

布尔全文索引

在布尔搜索中，我们可以在查询中自定义某个被搜索的词语的相关性，当编写一个布尔搜索查询时，可以通过一些前缀修饰符来定制搜索。

MySQL 内置的修饰符，上面查询最小搜索长度时，搜索结果 ft_boolean_syntax 变量的值就是内置的修饰符，下面简单解释几个，更多修饰符的作用可以查手册

+ 必须包含该词
- 必须不包含该词
> 提高该词的相关性，查询的结果靠前
< 降低该词的相关性，查询的结果靠后
(*)星号 通配符，只能接在词后面

对于上面提到的问题，可以使用布尔全文索引查询来解决，使用下面的命令，a、aa、aaa、aaaa 就都被查询出来了。

select * test where match(content) against(&#39;a*&#39; in boolean mode);

Salin selepas log masuk

总结

好了，差不多写完了，又到了总结的时候。

MySQL 的全文索引最开始仅支持英语，因为英语的词与词之间有空格，使用空格作为分词的分隔符是很方便的。亚洲文字，比如汉语、日语、汉语等，是没有空格的，这就造成了一定的限制。不过 MySQL 5.7.6 开始，引入了一个 ngram 全文分析器来解决这个问题，并且对 MyISAM 和 InnoDB 引擎都有效。

事实上，MyISAM 存储引擎对全文索引的支持有很多的限制，例如表级别锁对性能的影响、数据文件的崩溃、崩溃后的恢复等，这使得 MyISAM 的全文索引对于很多的应用场景并不适合。所以，多数情况下的建议是使用别的解决方案，例如 Sphinx、Lucene 等等第三方的插件，亦或是使用 InnoDB 存储引擎的全文索引。

几个注意点

使用全文索引前，搞清楚版本支持情况；
全文索引比 like + % 快 N 倍，但是可能存在精度问题；
如果需要全文索引的是大量数据，建议先添加数据，再创建索引；
对于中文，可以使用 MySQL 5.7.6 之后的版本，或者第三方插件。

【相关推荐：mysql视频教程】

Atas ialah kandungan terperinci Apakah indeks teks penuh mysql. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Arahan sembang dan cara menggunakannya

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7530

Tutorial CakePHP

1379

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Mysql: Konsep mudah untuk pembelajaran mudah Apr 10, 2025 am 09:29 AM

MySQL adalah sistem pengurusan pangkalan data sumber terbuka. 1) Buat Pangkalan Data dan Jadual: Gunakan perintah Createdatabase dan Createtable. 2) Operasi Asas: Masukkan, Kemas kini, Padam dan Pilih. 3) Operasi lanjutan: Sertai, subquery dan pemprosesan transaksi. 4) Kemahiran Debugging: Semak sintaks, jenis data dan keizinan. 5) Cadangan Pengoptimuman: Gunakan indeks, elakkan pilih* dan gunakan transaksi.

Cara membuka phpmyadmin Apr 10, 2025 pm 10:51 PM

Anda boleh membuka phpmyadmin melalui langkah -langkah berikut: 1. Log masuk ke panel kawalan laman web; 2. Cari dan klik ikon phpmyadmin; 3. Masukkan kelayakan MySQL; 4. Klik "Login".

Cara Membuat Premium Navicat Apr 09, 2025 am 07:09 AM

Buat pangkalan data menggunakan Navicat Premium: Sambungkan ke pelayan pangkalan data dan masukkan parameter sambungan. Klik kanan pada pelayan dan pilih Buat Pangkalan Data. Masukkan nama pangkalan data baru dan set aksara yang ditentukan dan pengumpulan. Sambung ke pangkalan data baru dan buat jadual dalam penyemak imbas objek. Klik kanan di atas meja dan pilih masukkan data untuk memasukkan data.

MySQL: Pengenalan kepada pangkalan data paling popular di dunia Apr 12, 2025 am 12:18 AM

MySQL adalah sistem pengurusan pangkalan data relasi sumber terbuka, terutamanya digunakan untuk menyimpan dan mengambil data dengan cepat dan boleh dipercayai. Prinsip kerjanya termasuk permintaan pelanggan, resolusi pertanyaan, pelaksanaan pertanyaan dan hasil pulangan. Contoh penggunaan termasuk membuat jadual, memasukkan dan menanyakan data, dan ciri -ciri canggih seperti Operasi Join. Kesalahan umum melibatkan sintaks SQL, jenis data, dan keizinan, dan cadangan pengoptimuman termasuk penggunaan indeks, pertanyaan yang dioptimumkan, dan pembahagian jadual.

Cara Membuat Sambungan Baru ke MySQL di Navicat Apr 09, 2025 am 07:21 AM

Anda boleh membuat sambungan MySQL baru di Navicat dengan mengikuti langkah -langkah: Buka aplikasi dan pilih Sambungan Baru (Ctrl N). Pilih "MySQL" sebagai jenis sambungan. Masukkan nama host/alamat IP, port, nama pengguna, dan kata laluan. (Pilihan) Konfigurasikan pilihan lanjutan. Simpan sambungan dan masukkan nama sambungan.

Cara menggunakan redis berulir tunggal Apr 10, 2025 pm 07:12 PM

Redis menggunakan satu seni bina berulir untuk memberikan prestasi tinggi, kesederhanaan, dan konsistensi. Ia menggunakan I/O multiplexing, gelung acara, I/O yang tidak menyekat, dan memori bersama untuk meningkatkan keserasian, tetapi dengan batasan batasan konkurensi, satu titik kegagalan, dan tidak sesuai untuk beban kerja yang berintensifkan.

Mengapa menggunakan mysql? Faedah dan kelebihan Apr 12, 2025 am 12:17 AM

MySQL dipilih untuk prestasi, kebolehpercayaan, kemudahan penggunaan, dan sokongan komuniti. 1.MYSQL Menyediakan fungsi penyimpanan dan pengambilan data yang cekap, menyokong pelbagai jenis data dan operasi pertanyaan lanjutan. 2. Mengamalkan seni bina pelanggan-pelayan dan enjin penyimpanan berganda untuk menyokong urus niaga dan pengoptimuman pertanyaan. 3. Mudah digunakan, menyokong pelbagai sistem operasi dan bahasa pengaturcaraan. 4. Mempunyai sokongan komuniti yang kuat dan menyediakan sumber dan penyelesaian yang kaya.

MySQL dan SQL: Kemahiran Penting untuk Pemaju Apr 10, 2025 am 09:30 AM

MySQL dan SQL adalah kemahiran penting untuk pemaju. 1.MYSQL adalah sistem pengurusan pangkalan data sumber terbuka, dan SQL adalah bahasa standard yang digunakan untuk mengurus dan mengendalikan pangkalan data. 2.MYSQL menyokong pelbagai enjin penyimpanan melalui penyimpanan data yang cekap dan fungsi pengambilan semula, dan SQL melengkapkan operasi data yang kompleks melalui pernyataan mudah. 3. Contoh penggunaan termasuk pertanyaan asas dan pertanyaan lanjutan, seperti penapisan dan penyortiran mengikut keadaan. 4. Kesilapan umum termasuk kesilapan sintaks dan isu -isu prestasi, yang boleh dioptimumkan dengan memeriksa penyataan SQL dan menggunakan perintah menjelaskan. 5. Teknik pengoptimuman prestasi termasuk menggunakan indeks, mengelakkan pengimbasan jadual penuh, mengoptimumkan operasi menyertai dan meningkatkan kebolehbacaan kod.

See all articles