MySQL 전체 텍스트 인덱스 애플리케이션에 대한 간략한 튜토리얼-MySQL 튜토리얼-php.cn

MySQL 전체 텍스트 인덱스 애플리케이션에 대한 간략한 튜토리얼

黄舟

풀어 주다： 2017-02-07 17:08:15

원래의

1366명이 탐색했습니다.

이 기사에서는 다음 측면에서 MySQL 전체 텍스트 인덱스에 대한 기본 지식을 소개합니다.

MySQL 전체 텍스트 인덱스에 대한 몇 가지 고려 사항
전체 텍스트 인덱스 구문
여러 검색 유형 소개
여러 검색 유형의 예

전체 텍스트 인덱스에 대한 몇 가지 참고 사항

검색은 전체 텍스트 유형의 인덱스 열에서 이루어져야 하며 일치에 지정된 열이 있어야 합니다. 전체 텍스트로 지정되어야 함
은 테이블 엔진이 MyIsam 유형인 테이블에만 적용할 수 있습니다(MySQL 5.6 이상은 Innodb 테이블 엔진에서도 사용할 수 있음)
전체 텍스트 인덱스는 char, varchar, text 유형의 열에만 생성할 수 있습니다.
일반 인덱스와 마찬가지로 테이블을 정의할 때 지정하거나 추가할 수 있습니다. 또는 테이블 생성 후 수정
대규모 레코드 삽입의 경우 인덱스가 없는 테이블에 데이터를 삽입한 후 인덱스를 생성하는 과정이 데이터에 삽입하는 것보다 훨씬 빠릅니다. 인덱스가 있는 테이블
검색 문자열은 상수 문자열이어야 하며 테이블의 열 이름이 될 수 없습니다.
검색 문자열의 선택성이 검색 기록이 50%를 초과하면 일치 항목이 없는 것으로 간주합니다(자연 검색에 한함)

전체 텍스트 인덱스 검색 구문

MATCH(열 이름 1 , 열 이름 2,…) AGAINST (검색 문자열 [검색 한정자 ])

match에 지정된 열 이름 1, 2 등은 전체 텍스트 인덱스 설정 시 지정된 열 이름입니다. 수정자는 다음과 같이 설명됩니다.

search_modifier:
{
IN NATURAL LANGUAGE MODE
| IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION
| IN BOOLEAN MODE
| WITH QUERY EXPANSION
}

로그인 후 복사

여러 검색 유형 소개

위의 검색 수정자는 실제로 3가지 전체 텍스트 검색 유형을 보여줍니다

자연어 모드

소개: 기본 검색 형식(검색 수정자가 없거나 수정자가 자연어 모드임)

특징:

검색 문자열의 문자는 일반 문자로 파싱되어 특별한 의미가 없습니다
마스크된 문자의 문자열을 필터링합니다. list
레코드의 선택도가 50%를 초과하면 일반적으로 불일치로 간주됩니다.
반환된 레코드가 정렬되어 표시됩니다. 관련성에 따라

부울 모드

소개 : 부울 모드 검색(수식자가 IN BOOLEAN MODE일 때 검색)

기능:

은 특정 규칙에 따라 검색 문자열에 있는 특수 문자의 의미를 분석하고 몇 가지 논리적 의미 규칙을 수행합니다. 예를 들어, 특정 단어는 반드시 나타나거나 나타날 수 없습니다.
이 유형의 검색으로 반환된 기록은 관련성에 따라 정렬되지 않습니다.

WITH QUERY EXPANSION

소개: 실제로 2개의 자연 검색을 수행하고 레코드를 직접 반환할 수 있는 약간 복잡한 검색 양식 레코드 소개 성적 관계, 수식어 IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION 또는 WITH QUERY EXPANSION 수식어

특징: 이 검색 유형은 실제로 다음과 같은 간접 검색 기능을 제공합니다. 단어를 검색했는데 반환된 첫 번째 행은 검색되지 않습니다. 검색어에 문자열 중 하나가 포함되어 있습니다. 1차 검색결과의 기록어를 기반으로 2차 매칭을 수행할 수 있으므로, 일부 간접적인 관계를 가지고 일치하는 기록을 찾는 것이 가능하다.

여러 검색 유형의 예

자연어 모드 모드의 적용:

는 여전히 제품 테이블에 적용되며 이름에 전체 텍스트 인덱스가 설정되어 있습니다. 필드에 키워드를 기준으로 이름 열에 해당 레코드를 일치시켜야 하기 때문에

SQL 문은 다음과 같습니다.

SELECT * FROM product WHERE match(name) against(‘auto’)

로그인 후 복사

시간도 나쁘지 않고 10,000개 이상의 레코드가 히트되었습니다. 거의 870,000이고 1.15초가 걸렸지만 효과는 여전히 좋습니다

참고: 기본적으로 레코드는 관련성에 따라 높은 수준에서 낮은 수준으로 반환됩니다

(이름)과( 'auto') FROM product 레코드의 상관 값을 확인하세요. 값은 0과 1 사이입니다. 0은 레코드가 일치하지 않음을 의미합니다.

몇 가지 중요한 기능:

1. 무시하세요

검색 단어가 너무 짧습니다. 기본 전체 텍스트 인덱스는 4자를 초과하는 단어를 유효한 단어로 간주합니다. 구성에서 ft_min_word_len을 수정하여

블록 단어를 구성할 수 있습니다. 기본 전체 텍스트 인덱스는 일부 일반적인 단어를 차단합니다. 이러한 단어는 너무 일반적이고 의미론적 영향이 없기 때문에 검색 프로세스에서 무시됩니다. 물론 이 목록도 구성 가능합니다.

2. 단어 분할을 수행하는 방법

전체 텍스트 인덱스는 연속된 유효한 문자(정규 표현식에서 w와 일치하는 문자 집합)를 단어로 간주합니다. "'"(연속) 두 개의 ''는 구분 기호로 간주됩니다. 기타 구분 기호: 공백, 쉼표, 마침표 등

IN BOOLEAN MODE 적용:

부울 일치 모드에서는 특수 기호를 추가하여 검색 프로세스에 일부 논리 기능을 추가할 수 있습니다. 공식 웹사이트에 제공된 예(mysql 문자열을 포함하고 Yousql을 포함하지 않는 명령문 검색):

SELECT * FROM articles WHERE MATCH (title,body)
-> AGAINST (‘+MySQL -YourSQL’ IN BOOLEAN MODE);

로그인 후 복사

可见，我们对搜索的控制又多了一些，看起来“高大上”了些。

实际上，上面的操作隐含了几个意思：

加号：相当于and
减号：相当于not
没有：相当于or

下面看下布尔类型搜索的几个重要特性：

1. 没有50%记录选择性的限制，即使搜索结果记录超过总数的50%也同样返回结果

2. 不会自动的按记录的相关性进行降序排序

3. 可以直接应用在没有创建fulltext的全文索引上，但是这样会查询的非常慢，所以说还是别用了。

4. 支持最小、最大单词长度

5. 应用屏蔽词列表

布尔搜索支持的操作符：

n 加号 +：指示修饰的单词必须出现在记录中

n 减号 -：指示修饰的单词必须不能出现在记录中

n 没有任何操作符：单词可有可无，但是包含该词的记录相关性高

n 双引号 “ ：将一个词组作为一个匹配。如：”one word” 匹配one word在一起的单词

下面是官方的一些实例：

至少包含一个词的记录
‘apple banana’
必须包含着两个词
‘+apple +juice’
必须包含apple，包含macintosh的记录相关性高，也可以不包含
‘+apple macintosh’
必须包含apple且不能喊有macintosh
‘+apple -macintosh’
查找apple开头单词的记录
‘apple*’
完整匹配some words单词
‘”some words”‘

로그인 후 복사

了解了基本的mysql全文索引知识，觉得它的全文索引比like当然是强了很多。但是面对高级的搜索还是略显简陋，且性能问题也是担忧。

以上就是MySQL 全文索引应用简明教程的内容，更多相关内容请关注PHP中文网（www.php.cn）！