在MySQL中获得更好的搜索结果

WBOY
發布: 2016-06-07 16:05:46
原創
840 人瀏覽過

很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处

很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。

MySQL针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然语言来智能地对结果评级,以去掉不相关的项目。

这篇文章将向您讲述在MySQL中如何进行全文搜索。

从创建例子表格开始,使用以下的SQL命令:

mysql> CREATE TABLE reviews (id INT(5) PRIMARY KEY NOT NULL <br>AUTO_INCREMENT, data TEXT);
登入後複製

以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:

mysql> INSERT INTO `reviews` (`id`, `data`) VALUES<br>(1, 'Gingerboy has a new single out called Throwing Rocks. <br>It\'s great!');<br>mysql> INSERT INTO `reviews` (`id`, `data`) VALUES <br>(2, 'Hello all, I really like the new Madonna single. <br>One of the hottest tracks currently playing...I\'ve been <br>listening to it all day');<br>mysql> INSERT INTO `reviews` (`id`, `data`)<br>VALUES (3, 'Have you heard the new band Hotter Than Hell?<br>They have five members and they burn their instruments <br>when they play in concerts. <br>These guys totally rock! Like, awesome, dude!');
登入後複製

验证数据的正确录入:

mysql> SELECT * FROM reviews;<br>+----+--------------------------------------------+<br>id  data                                       <br>+----+--------------------------------------------+<br>  1  Gingerboy has a new single out called ...  <br>  2  Hello all, I really like the new Madon ... <br>  3  Have you heard the new band Hotter Than... <br>+----+--------------------------------------------+<br>3 rows in set (0.00 sec)
登入後複製

接下来,定义您要作为全文搜索索引的字段

mysql> ALTER TABLE reviews ADD FULLTEXT INDEX (data);<br>Query OK, 3 rows affected (0.21 sec)<br>Records: 3  Duplicates: 0  Warnings: 0
登入後複製

使用SHOW INDEXES命令来检查索引已经被添加了:

mysql> SHOW INDEXES FROM reviews;<br>+---------+---------------+--------+------+------------+---------+<br>Table    Column_name    Packed  Null  Index_type  Comment <br>----------+---------------+--------+------+------------+---------+<br>reviews   id            NULL          BTREE               <br>reviews   data          NULL    YES   FULLTEXT            <br>+---------+---------------+--------+------+------------+---------+<p></p><p></p>
登入後複製


当您拥有了数据和索引,就可以使用MySQL的全文搜索了,最简单的全文搜索方式是带有MATCH...AGAINST语句的SELECT查询,以下是一个简单的例子,可以来查找含有单词“single”的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('single');+----+<br>id <br>+----+<br>  1 <br>  2 <br>+----+
登入後複製

2 rows in set (0.00 sec)

在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看--只需用逗号来分割字段列表。

当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。

想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:

mysql> SELECT id, MATCH (data) AGAINST ('rock') FROM reviews;<br>+----+-------------------------------+<br>id  MATCH (data) AGAINST ('rock') <br>+----+-------------------------------+<br>  1                              0 <br>  2                              0 <br>  3                1.3862514533815 <br>+----+-------------------------------+
登入後複製

3 rows in set (0.00 sec)

您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的IN BOOLEAN MODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('+single <br>-madonna' IN BOOLEAN MODE);<br>+----+<br>id <br>+----+<br>  1 <br>+----+
登入後複製

1 row in set (0.00 sec)

这一搜索特性通常用于搜索单词片断(而不是完整的词语),这可以通过在IN BOOLEAN MODE语句中的*(星号)操作符来实现,以下的例子展示了如何查找单词中含有“hot”的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hot*' <br>IN BOOLEAN MODE);+----+<br>id <br>+----+<br>  3 <br>  2 <br>+----+
登入後複製

2 rows in set (0.00 sec)

您还可以使用这种方法来查找至少一个传递到AGAINST的参数中,以下的例子查找了至少包含单词“hell”和“rocks”中的一个的记录:

mysql> SELECT id FROM reviews WHERE MATCH (data) AGAINST ('hell <br>rocks' IN BOOLEAN MODE);<br>+----+<br>id <br>+----+<br>  1 <br>  3 <br>+----+
登入後複製

3 rows in set (0.00 sec)

以上的这些例子演示了相对于传统的SELECT...LIKE语句,进行全文搜索的更有效的方法,当您下一次需要编写MySQL数据库搜索界面的时候,您可以尝试这一方法。

(责任编辑:海纳百川   qlmzl11268@hotmail.com   TEL:(010)68476606-8007)


來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板