首頁 資料庫 mysql教程 SQLServer 全文检索(full-text)语法

SQLServer 全文检索(full-text)语法

Jun 07, 2016 pm 06:03 PM
全文檢索

sql server 全文检索有两种搜索方式,一种是contains,另一种是freetext

sql server 全文检索有两种搜索方式,一种是contains,另一种是freetext。前者是包含,类似于

like '%关键词%',后者则是将一段文字分词以后对每个词进行搜索。

具体语法:
contains:

SELECT 字段1,字段2
FROM 表名
WHERE contains(字段,'"词一" or "词二"')

根据查找结果的相似度排序
SELECT 字段1,字段2
FROM 表名
inner join containstable(表名, 字段,'"词一" or "词二"',10) as k
on 表名.id = k.[key]
order by k.RANK DESC


freetext:

SELECT 字段1,字段2
FROM 表名
WHERE freetext(字段,'词一词二')

根据查找结果的相似度排序
SELECT 字段1,字段2
FROM 表名
inner join freetexttable(表名, 字段,'词一词二',10) as k
on 表名.id = k.[key]
order by k.RANK DESC

上文中freetexttable或containstable的10表示取10条数据

最近搜索了一下全文检索,发现了一些问题,现在总结如下:

全文索引和查询概念(摘自SQL 联机帮助)

全文索引、查询和同步化最主要的设计要求是,在注册进行全文检索的所有表上都有一个唯一的全文键列(或者单列主键)。全文索引对使用的重要字及其所在位置进行跟踪。

例如,假定有一个对 DevTools 表的全文索引。全文索引可能指出在 Abstract 列的第 423 个和第 982 个单词处找到了单词 Microsoft,所在的行与 ProductID 6 关联。该索引结构支持对所有包含被索引单词的项进行有效检索,以及高级检索操作,如短语检索和邻近检索。

为防止全文索引因包含很多对检索没有帮助的词而变得臃肿,a、and、is 或 the 这类额外的词都忽略不计。例如,指定"the products ordered during these summer months"与指定"products ordered during summer months"是一样的。有这两个字符串的行都会被返回。

目录 \Mssql\Ftdata\Sqlserver\Config 下提供了多种语言的干扰词列表。在安装带有全文检索支持的 Microsoft® SQL Server™ 时会创建这个目录,并同时安装干扰词文件。干扰词文件可以编辑。例如,高技术公司的系统管理员可以把单词 computer 添加到他们的干扰词表中去。(如果编辑干扰词文件,则必须在更改生效之前重新填充全文目录。)下表显示了干扰词文件及其相应的语言。

干扰词文件 语言
-------------- ---------
Noise.chs 简体中文
Noise.cht 繁体中文
Noise.dat 语言中性
Noise.deu 德语
Noise.eng 英语(英国)
Noise.enu 英语(美国)
Noise.esn 西班牙语
Noise.fra 法语
Noise.ita 意大利语
Noise.jpn 日语
Noise.kor 韩文
Noise.nld 荷兰语
Noise.sve 瑞典语


在处理全文查询时,检索引擎将满足检条件的行的键值返回给 Microsoft SQL Server。比如有一个 SciFi 表,其中 Book_No 列是主键列。

Book_No Writer Title
-------- ----------- --------------------------
A025 Asimov Foundation's Edge
A027 Asimov Foundation and Empire
C011 Clarke Childhood's End
V109 Verne Mysterious Island


假定想使用一个全文检索查询来查找包含单词 Foundation 的书名。在本例中,将从全文索引获得值 A025 和 A027。然后 SQL Server 用这些键值和其它栏的信息响应该查询。

下表显示了存储全文索引数据所使用的语言。这些语言基于 SQL Server 安装期间选择的 Unicode 排序规则区域设置标识符。

Unicode 排序规则区域设置标识符 全文数据存储所用的语言
------------------------------- -----------------------
中文注音符号(台湾) 繁体中文
汉语拼音 简体中文
中文笔画 简体中文
中文笔画(台湾) 繁体中文
荷兰语 荷兰语
英语(英国) 英语(英国)
法语 法语
通用 Unicode 英语(美国)
德语 德语
德文电话簿 德语
意大利语 意大利语
日语 日语
日语 Unicode 日语
韩文 韩文
韩文 Unicode 韩文
西班牙语(现代) 西班牙语
瑞典/芬兰语 瑞典语



此列表中没有的其它所有 Unicode 排序规则区域设置标识符值都映射到使用空格分隔单词的中性语言单词的断字符和词干分隔符。

说明 Unicode 排序规则区域设置标识符设置用于所有可进行全文索引的数据类型(如 char、nchar 等)。如果为 char、varchar 或 text 类型列的排序次序设置的语言类型,不是 Unicode 排序规则区域设置标识符语言,那么在对 char、varchar 和 text 类型的列进行全文索引和查询时,仍然使用 Unicode 排序规则区域设置标识符值。



创建全文索引(以索引image列为例,其他类型字段大致一样)

标题 全文索引image列,全攻略!
作者 pengdali [原作]
关键字 全文索引 image


今天“百年不遇”的停电了,看了一天书。晚上搞了一下全文索引,决定把心得贴出来,我尽量写的详细,大家共同学习,欢迎指正!

1、启动 Microsoft Search 服务
开始菜单-->SQL程序组-->服务管理器-->下拉筐-->Microsoft Search 服务-->启动它

2、
..\Microsoft SQL Server\MSSQL\FTDATA\SQLServer\Config\目录里建一个非空noise.chs文件
非空noise.chs文件,也有人说是空的noise.chs文件,但我每次都往里写几个没用的字母。

3、建立环境
打开查询分析器-->执行下列脚本:
--------------------------------------------
create database test ---创建test数据库
use test ---选择test数据库
create table dali (ID int not null primary key,MyImage image,FileType varchar(255),FileNmae varchar(255)) ---创建dali表
--dali表中 Id,MyImage,FileType 三列是必须的,因为要对image列索引的话,必须要有一个主键列,一个image列,一个存放文件类型的列
--我们知道在windows系统中文件类型是靠扩展名来区分的所以FileType列也就是用来放 文件的扩展名
--------------------------------------------

sp_fulltext_database 'enable' --为全文索引启用数据库
sp_fulltext_catalog 'My_FullDir', 'create' ---创建一个叫My_FullDif的全文目录

declare @Key sysname ; select @Key=c.name from syscolumns a,sysconstraints b,sysobjects c where a.id=object_id('dali') and a.name='ID' and a.id=b.id and b.constid=c.id and c.name like 'PK%'
exec sp_fulltext_table 'dali','create','My_FullDir',@Key ----这两句是为全文索引,对表进行标记

sp_fulltext_column 'dali','MyImage','add',0x0804,'FileType' ---这句是指定MyImage列为全文索引列,FileType是类型列
------------------------------------------------
4、在c盘下放一个扩展名为doc的word文件,一个扩展名为xls的excel文件,一个扩展名为htm的网页文件,个扩展名为bmp的图片
共4个,大家可根据实际情况放入!

5、插入数据
建立下面这个存储过程
--------------------------------------------------
CREATE PROCEDURE sp_textcopy
@srvname varchar (30),
@login varchar (30),
@password varchar (30),
@dbname varchar (30),
@tbname varchar (30),
@colname varchar (30),
@filename varchar (30),
@whereclause varchar (40),
@direction char(1)
AS
/* 这是使用textcopy工具将文件插入到数据库中,如果有前台工具可以用前台开发工具将文件插入,这里为了演示 */
DECLARE @exec_str varchar (255)
SELECT @exec_str='textcopy /S '+@srvname+' /U '+@login+' /P '+@password+' /D '+@dbname+' /T'+@tbname+' /C '+@colname+' /W"'+@whereclause+'" /F"'+@filename+'" /'+@direction
EXEC master..xp_cmdshell @exec_str
----------------------------------------------------

insert dali values(1,0x,'doc','大力的doc') ---其中第二列是 0x 它是一个16进制数对应image列,是必须的,不要写null,第三列是文件类型,既扩展名

sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\大力的doc.doc','where ID=1','I'
-------依次参数是:实例名,用户名,密码,数据库名,表名,image列名,路径及文件名,条件(你必须保证它只选择一行),I
---------------------------------------------------------------------------------------------------------------------
insert dali values(2,0x,'bmp','图片')
sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\图片.bmp','where ID=2','I' --注意条件是 ID=2

insert dali values(3,0x,'xls','Excel文件')
sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\Excel文件.xls','where ID=3','I' --注意条件是 ID=3

insert dali values(4,0x,'htm','网页')
sp_textcopy '你的服务器名','sa','你的密码','test','dali','MyImage','c:\网页.htm','where ID=4','I' --注意条件是 ID=4

----------上面的语句,要保证类型一样,路径正确,条件唯一正确应该就可以了

6、填充全文索引

sp_fulltext_table 'dali','start_full' ---第一个参数是表名,第二个参数是启动表的全文索引的完全填充

7、可以开始你的实验了

select * from dali where contains(MyImage,'J老师')

select * from dali where contains(MyImage,'海老师')

------END----------
--调试环境:SQLServer2000企业版、Windows2000高级服务器

全文索引中的几个问题:

1.搜索时出现错误:
服务器: 消息 7619,级别 16,状态 1,行 2
查询子句只包含被忽略的词

这种情况修改 \Mssql\Ftdata\Sqlserver\Config 下对应语言的干扰词列表文件

2.修改了干扰词文件,查询中文时仍然出现上述问题
a.首先检查你的SQL有没有安装最新的补丁,检查的方法是在查询分析器中运行:
select @@version
如果出来的版本号是8.00.760以下,则表明你未安装sp3的补丁,要装上.

SQL补丁下载:


注意下载后,执行的时候是解压,要在解压后的目录中执行setup.bat才是真正的安装

b.配置全文索引时,单词断字符选择"中文(中国)"

c.Noise.chs文件中至少有一个单词,例如:?

d.如果在全文检索时,你能正常修改干扰词文件,说明你的全文检索没有使用上这个文件
如果你配置的全文检索应该要用到这个文件,那就在
企业管理器--展开你的数据库--右键全文目录--重建全部全文目录

3.表中的数据改变后,检索不到
方法1. 右键你的表--全文索引表--启用增量填充
方法2. 右键你的表--全文索引表--更改跟踪,这样以后的修改会自动填充(有一定延迟)

4.sql2000才支持对image列的全文检索

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Java開發:如何實作搜尋引擎和全文檢索功能 Java開發:如何實作搜尋引擎和全文檢索功能 Sep 21, 2023 pm 01:10 PM

Java開發:如何實現搜尋引擎和全文檢索功能,需要具體程式碼範例搜尋引擎和全文檢索是現代網路時代的重要功能。它們不僅可以幫助用戶快速找到想要的內容,還可以為網站和應用程式提供更好的用戶體驗。本文將介紹如何使用Java開發搜尋引擎和全文檢索功能,並提供一些具體的程式碼範例。使用Lucene函式庫實作全文檢索Lucene是一款開源的全文檢索引擎函式庫,由ApacheSo

使用Go語言編寫高效能的全文檢索引擎 使用Go語言編寫高效能的全文檢索引擎 Jun 15, 2023 pm 11:51 PM

隨著網路時代的到來,全文檢索引擎越來越受到人們的重視。在無數的網頁、文件和資料中,我們需要快速找到所需的內容,這就需要使用高效率的全文檢索引擎。 Go語言是一種以效率而聞名的程式語言,它的設計目標是提高程式碼的執行效率和效能。因此,使用Go語言編寫全文檢索引擎可以大大提高其運作效率和效能。本文將介紹如何使用Go語言撰寫高效能的全文檢索引擎。一、理解全文檢索引擎

PHP與Elasticsearch整合實作全文檢索功能詳解 PHP與Elasticsearch整合實作全文檢索功能詳解 Jun 25, 2023 am 10:14 AM

隨著網路的發展,企業面對的文字資料越來越龐大。如何快速、精確地檢索相關內容,成為企業在資訊化領域的重要議題之一。 Elasticsearch作為一個基於Lucene的開源搜尋引擎,具有高可用性、高可擴展性和快速檢索的特點,成為企業全文檢索的首選方案之一。而PHP作為一門流行的伺服器端程式語言,也能夠快速進行Web開發與API開發,成為與Elasticsea

PHP開發即時聊天功能的全文檢索與訊息搜尋技術 PHP開發即時聊天功能的全文檢索與訊息搜尋技術 Aug 13, 2023 pm 06:51 PM

PHP開發即時聊天功能的全文檢索和訊息搜尋技術隨著即時通訊的普及和應用的擴大,即時聊天功能已成為許多網站和應用的必備特性。在即時聊天中,用戶可以發送和接收訊息,並允許用戶搜尋歷史訊息進行回顧和尋找。為了實現這項功能,我們可以採用全文檢索和訊息搜尋技術。全文檢索是指在大量文字中快速搜尋關鍵字的技術。它可以有效提高訊息搜尋的效率和準確性。在PHP開發中,我們

PHP學習指南:如何實作全文檢索功能 PHP學習指南:如何實作全文檢索功能 Aug 26, 2023 pm 06:04 PM

PHP學習指南:如何實現全文檢索功能全文檢索功能在現代網站和應用中被廣泛使用,它允許使用者透過關鍵字搜尋並檢索相關的內容。在本文中,我們將討論如何使用PHP實現全文檢索功能。一、準備工作在開始編寫程式碼之前,我們需要確保伺服器上安裝了Elasticsearch。 Elasticsearch是一個開源的用於全文搜尋和分析的伺服器端工具,它提供了一個強大的搜尋引擎,

PHP開發:如何使用 Elasticsearch 實現全文檢索 PHP開發:如何使用 Elasticsearch 實現全文檢索 Jun 14, 2023 pm 05:07 PM

在現代Web應用程式中,資料量越來越大,但使用者期望和對資料的存取也越來越廣泛。因此,搜尋技術變得越來越重要,能夠滿足用戶的預期並提供更好的用戶體驗。全文搜尋是一種強大的技術,能夠快速索引、搜尋和排序大量資料。在這方面,Elasticsearch是一個領先的開源搜尋引擎,它提供了許多先進的特性以及高可用性、易擴展性等優勢。在本篇文章中,將介紹如何透過PHP使用

PHP中如何進行全文檢索? PHP中如何進行全文檢索? May 13, 2023 am 08:00 AM

隨著網路技術的不斷發展,資料量的爆炸性成長和各種文字資料的廣泛應用,全文檢索成為了非常重要的技術。全文檢索是一種能夠快速、準確地找到文字資料的方法,廣泛應用於搜尋引擎、論壇、部落格、電商網站等應用程式場景。在PHP程式設計中,如何實現全文檢索呢?一、什麼是全文檢索?在傳統的關係型資料庫中,我們通常會使用SQL語句進行模糊查詢,但是當資料量較大時,這種查詢方法會

Swoole與ElasticSearch的完美結合:建立高效能的全文檢索引擎 Swoole與ElasticSearch的完美結合:建立高效能的全文檢索引擎 Jun 14, 2023 pm 12:44 PM

隨著雲端運算和大數據技術的不斷發展,全文檢索引擎的應用越來越廣泛,成為資料分析、智慧搜尋、資訊管理等領域中不可或缺的一部分。而在全文檢索引擎的實作中,Swoole和ElasticSearch無疑是兩個強大的工具,結合起來可以建構高效能的全文檢索引擎。 Swoole是一個基於PHP語言的高效能網路通訊框架,它支援多進程、協程、非同步、並發等特性。 ElasticSea

See all articles