SQLServer 全文检索(full-text)语法
sql server 全文检索有两种搜索方式,一种是contains,另一种是freetext
sql server 全文检索有两种搜索方式,一种是contains,另一种是freetext。前者是包含,类似于like '%关键词%',后者则是将一段文字分词以后对每个词进行搜索。
具体语法:
contains:
SELECT 字段1,字段2
FROM 表名
WHERE contains(字段,'"词一" or "词二"')
根据查找结果的相似度排序
SELECT 字段1,字段2
FROM 表名
inner join containstable(表名, 字段,'"词一" or "词二"',10) as k
on 表名.id = k.[key]
order by k.RANK DESC
freetext:
SELECT 字段1,字段2
FROM 表名
WHERE freetext(字段,'词一词二')
根据查找结果的相似度排序
SELECT 字段1,字段2
FROM 表名
inner join freetexttable(表名, 字段,'词一词二',10) as k
on 表名.id = k.[key]
order by k.RANK DESC
上文中freetexttable或containstable的10表示取10条数据
最近搜索了一下全文检索,发现了一些问题,现在总结如下:
全文索引和查询概念(摘自SQL 联机帮助)
全文索引、查询和同步化最主要的设计要求是,在注册进行全文检索的所有表上都有一个唯一的全文键列(或者单列主键)。全文索引对使用的重要字及其所在位置进行跟踪。
例如,假定有一个对 DevTools 表的全文索引。全文索引可能指出在 Abstract 列的第 423 个和第 982 个单词处找到了单词 Microsoft,所在的行与 ProductID 6 关联。该索引结构支持对所有包含被索引单词的项进行有效检索,以及高级检索操作,如短语检索和邻近检索。
为防止全文索引因包含很多对检索没有帮助的词而变得臃肿,a、and、is 或 the 这类额外的词都忽略不计。例如,指定"the products ordered during these summer months"与指定"products ordered during summer months"是一样的。有这两个字符串的行都会被返回。
目录 \Mssql\Ftdata\Sqlserver\Config 下提供了多种语言的干扰词列表。在安装带有全文检索支持的 Microsoft® SQL Server™ 时会创建这个目录,并同时安装干扰词文件。干扰词文件可以编辑。例如,高技术公司的系统管理员可以把单词 computer 添加到他们的干扰词表中去。(如果编辑干扰词文件,则必须在更改生效之前重新填充全文目录。)下表显示了干扰词文件及其相应的语言。
干扰词文件 语言
-------------- ---------
Noise.chs 简体中文
Noise.cht 繁体中文
Noise.dat 语言中性
Noise.deu 德语
Noise.eng 英语(英国)
Noise.enu 英语(美国)
Noise.esn 西班牙语
Noise.fra 法语
Noise.ita 意大利语
Noise.jpn 日语
Noise.kor 韩文
Noise.nld 荷兰语
Noise.sve 瑞典语
在处理全文查询时,检索引擎将满足检条件的行的键值返回给 Microsoft SQL Server。比如有一个 SciFi 表,其中 Book_No 列是主键列。
Book_No Writer Title
-------- ----------- --------------------------
A025 Asimov Foundation's Edge
A027 Asimov Foundation and Empire
C011 Clarke Childhood's End
V109 Verne Mysterious Island
假定想使用一个全文检索查询来查找包含单词 Foundation 的书名。在本例中,将从全文索引获得值 A025 和 A027。然后 SQL Server 用这些键值和其它栏的信息响应该查询。
下表显示了存储全文索引数据所使用的语言。这些语言基于 SQL Server 安装期间选择的 Unicode 排序规则区域设置标识符。
Unicode 排序规则区域设置标识符 全文数据存储所用的语言
------------------------------- -----------------------
中文注音符号(台湾) 繁体中文
汉语拼音 简体中文
中文笔画 简体中文
中文笔画(台湾) 繁体中文
荷兰语 荷兰语
英语(英国) 英语(英国)
法语 法语
通用 Unicode 英语(美国)
德语 德语
德文电话簿 德语
意大利语 意大利语
日语 日语
日语 Unicode 日语
韩文 韩文
韩文 Unicode 韩文
西班牙语(现代) 西班牙语
瑞典/芬兰语 瑞典语
此列表中没有的其它所有 Unicode 排序规则区域设置标识符值都映射到使用空格分隔单词的中性语言单词的断字符和词干分隔符。
说明 Unicode 排序规则区域设置标识符设置用于所有可进行全文索引的数据类型(如 char、nchar 等)。如果为 char、varchar 或 text 类型列的排序次序设置的语言类型,不是 Unicode 排序规则区域设置标识符语言,那么在对 char、varchar 和 text 类型的列进行全文索引和查询时,仍然使用 Unicode 排序规则区域设置标识符值。
创建全文索引(以索引image列为例,其他类型字段大致一样)
标题 全文索引image列,全攻略!
作者 pengdali [原作]
关键字 全文索引 image
今天“百年不遇”的停电了,看了一天书。晚上搞了一下全文索引,决定把心得贴出来,我尽量写的详细,大家共同学习,欢迎指正!
1、启动 Microsoft Search 服务
开始菜单-->SQL程序组-->服务管理器-->下拉筐-->Microsoft Search 服务-->启动它
2、
..\Microsoft SQL Server\MSSQL\FTDATA\SQLServer\Config\目录里建一个非空noise.chs文件
非空noise.chs文件,也有人说是空的noise.chs文件,但我每次都往里写几个没用的字母。
3、建立环境
打开查询分析器-->执行下列脚本:
--------------------------------------------
create database test ---创建test数据库
use test ---选择test数据库
create table dali (ID int not null primary key,MyImage image,FileType varchar(255),FileNmae varchar(255)) ---创建dali表
--dali表中 Id,MyImage,FileType 三列是必须的,因为要对image列索引的话,必须要有一个主键列,一个image列,一个存放文件类型的列
--我们知道在windows系统中文件类型是靠扩展名来区分的所以FileType列也就是用来放 文件的扩展名
--------------------------------------------
sp_fulltext_database 'enable' --为全文索引启用数据库
sp_fulltext_catalog 'My_FullDir', 'create' ---创建一个叫My_FullDif的全文目录
declare @Key sysname ; select @Key=c.name from syscolumns a,sysconstraints b,sysobjects c where a.id=object_id('dali') and a.name='ID' and a.id=b.id and b.constid=c.id and c.name like 'PK%'
exec sp_fulltext_table 'dali','create','My_FullDir',@Key ----这两句是为全文索引,对表进行标记
sp_fulltext_column 'dali','MyImage','add',0x0804,'FileType' ---这句是指定MyImage列为全文索引列,FileType是类型列
------------------------------------------------
4、在c盘下放一个扩展名为doc的word文件,一个扩展名为xls的excel文件,一个扩展名为htm的网页文件,个扩展名为bmp的图片
共4个,大家可根据实际情况放入!
5、插入数据
建立下面这个存储过程
--------------------------------------------------
CREATE PROCEDURE sp_textcopy
@srvname varchar (30),
@login varchar (30),
@password varchar (30),
@dbname varchar (30),
@tbname varchar (30),
@colname varchar (30),
@filename varchar (30),
@whereclause varchar (40),
@direction char(1)
AS
/* 这是使用textcopy工具将文件插入到数据库中,如果有前台工具可以用前台开发工具将文件插入,这里为了演示 */
DECLARE @exec_str varchar (255)
SELECT @exec_str='textcopy /S '+@srvname+' /U '+@login+' /P '+@password+' /D '+@dbname+' /T'+@tbname+' /C '+@colname+' /W"'+@whereclause+'" /F"'+@filename+'" /'+@direction
EXEC master..xp_cmdshell @exec_str
----------------------------------------------------
insert dali values(1,0x,'doc','大力的doc') ---其中第二列是 0x 它是一个16进制数对应image列,是必须的,不要写null,第三列是文件类型,既扩展名
sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\大力的doc.doc','where ID=1','I'
-------依次参数是:实例名,用户名,密码,数据库名,表名,image列名,路径及文件名,条件(你必须保证它只选择一行),I
---------------------------------------------------------------------------------------------------------------------
insert dali values(2,0x,'bmp','图片')
sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\图片.bmp','where ID=2','I' --注意条件是 ID=2
insert dali values(3,0x,'xls','Excel文件')
sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\Excel文件.xls','where ID=3','I' --注意条件是 ID=3
insert dali values(4,0x,'htm','网页')
sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\网页.htm','where ID=4','I' --注意条件是 ID=4
----------上面的语句,要保证类型一样,路径正确,条件唯一正确应该就可以了
6、填充全文索引
sp_fulltext_table 'dali','start_full' ---第一个参数是表名,第二个参数是启动表的全文索引的完全填充
7、可以开始你的实验了
select * from dali where contains(MyImage,'J老师')
select * from dali where contains(MyImage,'海老师')
------END----------
--调试环境:SQLServer2000企业版、Windows2000高级服务器
全文索引中的几个问题:
1.搜索时出现错误:
服务器: 消息 7619,级别 16,状态 1,行 2
查询子句只包含被忽略的词
这种情况修改 \Mssql\Ftdata\Sqlserver\Config 下对应语言的干扰词列表文件
2.修改了干扰词文件,查询中文时仍然出现上述问题
a.首先检查你的SQL有没有安装最新的补丁,检查的方法是在查询分析器中运行:
select @@version
如果出来的版本号是8.00.760以下,则表明你未安装sp3的补丁,要装上.
SQL补丁下载:
注意下载后,执行的时候是解压,要在解压后的目录中执行setup.bat才是真正的安装
b.配置全文索引时,单词断字符选择"中文(中国)"
c.Noise.chs文件中至少有一个单词,例如:?
d.如果在全文检索时,你能正常修改干扰词文件,说明你的全文检索没有使用上这个文件
如果你配置的全文检索应该要用到这个文件,那就在
企业管理器--展开你的数据库--右键全文目录--重建全部全文目录
3.表中的数据改变后,检索不到
方法1. 右键你的表--全文索引表--启用增量填充
方法2. 右键你的表--全文索引表--更改跟踪,这样以后的修改会自动填充(有一定延迟)
4.sql2000才支持对image列的全文检索

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Java 개발: 검색 엔진 및 전체 텍스트 검색 기능을 구현하는 방법, 특정 코드 예제가 필요합니다. 검색 엔진 및 전체 텍스트 검색은 현대 인터넷 시대에 중요한 기능입니다. 사용자가 원하는 것을 빠르게 찾을 수 있도록 도울 뿐만 아니라 웹사이트와 앱에 대한 더 나은 사용자 경험을 제공합니다. 이 기사에서는 Java를 사용하여 검색 엔진 및 전체 텍스트 검색 기능을 개발하는 방법을 소개하고 몇 가지 구체적인 코드 예제를 제공합니다. Lucene 라이브러리를 사용한 전체 텍스트 검색 Lucene은 ApacheSo에서 개발한 오픈 소스 전체 텍스트 검색 엔진 라이브러리입니다.

인터넷 시대의 도래와 함께 전문 검색 엔진이 점점 더 주목을 받고 있습니다. 수많은 웹 페이지, 문서, 데이터 중에서 필요한 콘텐츠를 빠르게 찾아야 하며, 이를 위해서는 효율적인 전체 텍스트 검색 엔진을 사용해야 합니다. Go 언어는 효율성으로 유명한 프로그래밍 언어입니다. 디자인 목표는 코드 실행 효율성과 성능을 향상시키는 것입니다. 따라서 Go 언어를 사용하여 전체 텍스트 검색 엔진을 작성하면 운영 효율성과 성능을 크게 향상시킬 수 있습니다. 이 기사에서는 Go 언어를 사용하여 고성능 전체 텍스트 검색 엔진을 작성하는 방법을 소개합니다. 1. 전체 텍스트 검색 엔진 이해

인터넷의 발달로 기업은 점점 더 많은 양의 텍스트 데이터에 직면해 있습니다. 관련 콘텐츠를 어떻게 빠르고 정확하게 검색하는가는 정보분야 기업의 중요한 이슈 중 하나가 되었습니다. Lucene을 기반으로 하는 오픈 소스 검색 엔진인 Elasticsearch는 고가용성, 높은 확장성 및 빠른 검색이라는 특징을 갖고 있어 기업 전체 텍스트 검색에 선호되는 솔루션 중 하나입니다. 널리 사용되는 서버 측 프로그래밍 언어인 PHP는 웹 개발 및 API 개발도 빠르게 수행할 수 있어 Elasticsea와 파트너가 됩니다.

PHP는 실시간 채팅 기능을 위한 전체 텍스트 검색 및 메시지 검색 기술을 개발합니다. 인스턴트 메시징의 인기와 애플리케이션의 확장으로 인해 실시간 채팅 기능은 많은 웹사이트와 애플리케이션의 필수 기능이 되었습니다. 라이브 채팅에서 사용자는 메시지를 주고받을 수 있으며, 사용자는 기록 메시지를 검색하여 검토하고 찾을 수 있습니다. 이 기능을 달성하기 위해 전체 텍스트 검색 및 메시지 검색 기술을 사용할 수 있습니다. 전문 검색이란 많은 양의 텍스트에서 키워드를 빠르게 검색하는 기술을 말합니다. 메시지 검색의 효율성과 정확성을 효과적으로 향상시킬 수 있습니다. PHP 개발에서 우리는

PHP 학습 가이드: 전체 텍스트 검색 기능을 구현하는 방법 전체 텍스트 검색 기능은 최신 웹사이트와 애플리케이션에서 널리 사용되며, 이를 통해 사용자는 키워드로 관련 콘텐츠를 검색하고 검색할 수 있습니다. 이 기사에서는 PHP를 사용하여 전체 텍스트 검색 기능을 구현하는 방법에 대해 설명합니다. 1. 준비 코드 작성을 시작하기 전에 Elasticsearch가 서버에 설치되어 있는지 확인해야 합니다. Elasticsearch는 전체 텍스트 검색 및 분석을 위한 오픈 소스 서버 측 도구로, 강력한 검색 엔진을 제공합니다.

최신 웹 애플리케이션에서는 데이터 양이 증가하고 있지만 사용자 기대치와 데이터에 대한 액세스도 증가하고 있습니다. 따라서 사용자 기대를 충족하고 더 나은 사용자 경험을 제공하기 위해 검색 기술이 점점 더 중요해지고 있습니다. 전체 텍스트 검색은 대량의 데이터를 빠르게 색인화하고, 검색하고, 정렬할 수 있는 강력한 기술입니다. 이러한 측면에서 Elasticsearch는 고가용성, 손쉬운 확장성 및 기타 장점은 물론 다양한 고급 기능을 제공하는 선도적인 오픈 소스 검색 엔진입니다. 이번 글에서는 사용법을 소개하겠습니다.

인터넷 기술의 지속적인 발전과 데이터 양의 폭발적인 증가, 다양한 텍스트 데이터의 광범위한 적용으로 인해 전문 검색은 매우 중요한 기술이 되었습니다. 전체 텍스트 검색은 텍스트 데이터를 빠르고 정확하게 찾을 수 있는 방법으로, 검색 엔진, 포럼, 블로그, 전자상거래 웹사이트 등의 응용 시나리오에서 널리 사용됩니다. PHP 프로그래밍에서 전체 텍스트 검색을 구현하는 방법은 무엇입니까? 1. 전체 텍스트 검색이란 무엇입니까? 전통적인 관계형 데이터베이스에서는 일반적으로 퍼지 쿼리에 SQL 문을 사용합니다. 그러나 데이터 양이 많을 경우 이 쿼리 방법을 사용합니다.

클라우드 컴퓨팅과 빅 데이터 기술의 지속적인 발전으로 인해 전문 검색 엔진은 점점 더 널리 사용되고 있으며 데이터 분석, 지능형 검색, 정보 관리 및 기타 분야에서 없어서는 안될 부분이 되었습니다. 전체 텍스트 검색 엔진 구현에서 Swoole과 ElasticSearch는 의심할 여지 없이 결합하여 고성능 전체 텍스트 검색 엔진을 구축할 수 있는 두 가지 강력한 도구입니다. Swoole은 PHP 언어 기반의 고성능 네트워크 통신 프레임워크로 다중 프로세스, 코루틴, 비동기, 동시성 및 기타 기능을 지원합니다. 엘라스틱시
