sql全文检索(full-text)用法与注意事项
本文章来总结了SQL Server全文检索(full-text)用法与注意事项,有需要学习与了解sqlserver全文搜索的朋友可参考本文章。
SQL Server全文搜索 一项强大而又让人无可奈何的技术!说他强大,是因为他的检索速度极快,比like快几十上百倍。说他让人无可奈何,是因为很多场合对准确性要求很高,使用者又不能自己很好的组织查询语句,所以查出来的结果让人觉得没有确定性。
原本觉得这技术很不错,但真正研究起来,发现问题还是很多,研究到最后觉得这技术对柳永法(yongfa365)'Blog来说,只会用到对精确度不高的场合,像:CMS系统,大量文章,根据tag进行快速检索,这时他的快速检索优势能发挥出来,其它地方,真不敢用。像OA,各种业务系统,用他搜索不出要的东西,或者尝试很多次搜索,那用户还不郁闷死。暂且把研究结果放上来,以备后查。
前段时间做了个系统,记录客户的地址,下次再输入类似的地址,系统会进行分词,然后搜索看这个客户是不是已经在我们系统里了。感觉全文搜索能实现这样的功能就好了:就是,根据哪些词索引由用户自己定义(如:朝阳区|海淀区|东城区|左家庄|中关村 等,整个北京的地名,也没多少关键词),只对这些词进行索引,这样一来查询速度会更快,全文目录所占的地方也会更小,不知为何SQL Server没提供这样的功能,也许这只是 个例 吧。
全文查询只需要几秒或更少的时间,具体取决于返回的行数。
可以对包含 char、varchar 和 nvarchar 数据的列创建全文索引。也可以对包含格式化二进制数据(如存储在 varbinary(max) 或 image 列中的 Microsoft Word 文档)的列创建全文索引。不能使用 LIKE 谓词来查询格式化的二进制数据。
创建全文索引 创建全文索引的一个前提是,表中必须有这样的一个索引“unique, single-column, non-nullable index”。大多数情况下,主键都会满足这样的要求。 SQL Server这样做的实际要求是: 1. 必须有非空索引(主键都会满足这样的要求)。 2. 索引必须作用在单独一个列上。复合主键是不满足这个要求,一个work around是可以新建立一列,如textid,int型,自增,并建立索引。 提示:如果你的主键过长,笔者也建议新建一个int型自增列,例如主键是GUID的话,那么创建全文索引开销会是非常巨大的。
最简步骤:(以AdventureWorks数据库中的databaselog表中的event字段为例)
代码如下 | 复制代码 |
1、 启用全文索引: use AdventureWorks exec sp_fulltext_database 'enable' 2、 全文索引是存储在指定的文件系统中的,而不是SQLServer中。 exec sp_fulltext_catalog 'Cat_Desc', 'create', 'f:ft' 创建全文索引的目录 3、 对表创建全文索引 exec sp_fulltext_table 'databaselog', 'create', 'Cat_Desc', 'PK_DatabaseLog_DatabaseLogID' 在已有的表上根据已有的索引创建全文索引 4、 对表中的列添加全文索引 exec sp_fulltext_column 'databaselog', 'event', 'add' 5、 表启动完全填充 exec sp_fulltext_table 'databaselog', 'start_full' 6、 执行全文检索 select * from freetexttable(databaselog, event,'ALTER_TABLE'); |
注意事项:
•为了让全文搜索更好的运行,请选用nvarchar,放弃使用varchar 原因见:SQL Server全文搜索关于varchar与nvarchar的问题
•全文搜索不适合对精准度要求很高的场合,如,查找"show.aspx?id=",是查不出来的,推荐使用SQL Server CLR, 教程:SQL Server CLR 极速入门,启用、设计、部署、运行
•全文搜索最好是配合分词组件工作,分词后再使用全文搜索查找,分词组件见:盘古分词
操作:
1.确保服务已启用:在"SQL Server 配置管理器"里设置"SQL Server FullText Search"启动状态为"自动"
2.建全文索引最直观的方法是:右击相关表-->全文索引-->定义全文索引-->然后基本上是下一步就完成了。
最常用语法:
代码如下 | 复制代码 |
SELECT * FROM [test] WHERE CONTAINS(UserName,'柳永法'); |
SQL Server全文搜索关于varchar与nvarchar的问题
SQL Server全文搜索有一个问题,就是记录不全,上周末经过分析发现,
1.字段类型是varchar 且 如果搜索的的词正好是文章的结尾,就搜索不到,解决方法是在他后边再加上一个.让他不是在文章最后就行
2.字段类型换成nvarchar后,问题解决
代码如下 | 复制代码 |
CREATE DATABASE test USE test |
--对test表建全文索引,列选择txtTitle1, txtTitle2。方法如下:
--右击要建全文索引的表-->全文索引-->定义全文索引-->点几下"下一步"直到“选择表列”
-->选中要建立全文索引的列-->下一步-->自动-->创建新目录(写上名称,选位置,其它自便)
-->点几下"下一步"直到完成,这时系统会开始建全文目录,建好没有可以在当前数据库所在:
--展开当前数据库-->存储-->全文目录-->右击,你刚才起的名,如果“重新生成”是灰色,
--说明系统当前正在生成,如果可以点,说明生成完了
代码如下 | 复制代码 |
--针对varchar的列txtTitle1 只要查询里是以 '法' 结尾,都查不出记录来 --在txttitle列末尾随便加一个字符 |
--重建索引后,再执行上面的查询,结果都 是50
--通过以上示例得出结论:只要在设计字段时把varchar改成nvarchar,就可以解决我们的问题,且nvarchar有个好处就是:如果数据库服务器部署在非中文的系统上时,不会出现乱码问题。
详细的全文搜索参考http://msdn.microsoft.com/zh-cn/library/ms142571(v=SQL.100).aspx
全文检索很容易建立,一旦建立,快速的响应将给使用者和用户带来惊喜!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Pembangunan Java: Bagaimana untuk melaksanakan enjin carian dan fungsi mendapatkan semula teks penuh, contoh kod khusus diperlukan Enjin carian dan mendapatkan semula teks penuh adalah fungsi penting dalam era Internet moden. Mereka bukan sahaja membantu pengguna mencari perkara yang mereka inginkan dengan cepat, mereka juga menyediakan pengalaman pengguna yang lebih baik untuk tapak web dan apl. Artikel ini akan memperkenalkan cara menggunakan Java untuk membangunkan enjin carian dan fungsi perolehan teks penuh, dan menyediakan beberapa contoh kod khusus. Carian teks penuh menggunakan perpustakaan Lucene Lucene ialah perpustakaan enjin carian teks penuh sumber terbuka, dibangunkan oleh ApacheSo

Dengan kemunculan era Internet, enjin carian teks penuh telah menarik lebih banyak perhatian. Di antara banyak halaman web, dokumen dan data, kita perlu mencari kandungan yang diperlukan dengan cepat, yang memerlukan penggunaan enjin carian teks penuh yang cekap. Bahasa Go ialah bahasa pengaturcaraan yang terkenal dengan kecekapannya. Matlamat reka bentuknya adalah untuk meningkatkan kecekapan dan prestasi pelaksanaan kod. Oleh itu, menggunakan bahasa Go untuk menulis enjin carian teks penuh boleh meningkatkan kecekapan dan prestasi pengendaliannya. Artikel ini akan memperkenalkan cara menggunakan bahasa Go untuk menulis enjin carian teks penuh berprestasi tinggi. 1. Fahami enjin carian teks penuh

Dengan perkembangan Internet, perusahaan berhadapan dengan jumlah data teks yang semakin besar. Cara mendapatkan semula kandungan yang berkaitan dengan cepat dan tepat telah menjadi salah satu isu penting bagi perusahaan dalam bidang maklumat. Sebagai enjin carian sumber terbuka berdasarkan Lucene, Elasticsearch mempunyai ciri-ciri ketersediaan tinggi, berskala tinggi dan perolehan pantas, menjadikannya salah satu penyelesaian pilihan untuk mendapatkan semula teks penuh perusahaan. Sebagai bahasa pengaturcaraan sebelah pelayan yang popular, PHP juga boleh menjalankan pembangunan web dan pembangunan API dengan cepat, menjadi rakan kongsi dengan Elasticsea

PHP membangunkan mendapatkan teks penuh dan teknologi carian mesej untuk fungsi sembang masa nyata Dengan populariti pemesejan segera dan pengembangan aplikasi, fungsi sembang masa nyata telah menjadi ciri penting bagi banyak laman web dan aplikasi. Dalam sembang langsung, pengguna boleh menghantar dan menerima mesej, dan pengguna dibenarkan mencari mesej sejarah untuk disemak dan dicari. Untuk mencapai fungsi ini, kami boleh menggunakan teknologi carian teks dan carian mesej penuh. Carian teks penuh merujuk kepada teknologi mencari kata kunci dengan pantas dalam jumlah teks yang banyak. Ia boleh meningkatkan kecekapan dan ketepatan carian mesej dengan berkesan. Dalam pembangunan PHP kami

Panduan Kajian PHP: Cara Melaksanakan Fungsi Carian Teks Penuh Fungsi carian teks penuh digunakan secara meluas dalam laman web dan aplikasi moden, yang membolehkan pengguna mencari dan mendapatkan semula kandungan yang berkaitan mengikut kata kunci. Dalam artikel ini, kami akan membincangkan cara melaksanakan fungsi carian teks penuh menggunakan PHP. 1. Persediaan Sebelum mula menulis kod, kita perlu memastikan bahawa Elasticsearch dipasang pada pelayan. Elasticsearch ialah alat bahagian pelayan sumber terbuka untuk carian dan analisis teks penuh Ia menyediakan enjin carian yang berkuasa.

Dalam aplikasi web moden, volum data semakin meningkat, tetapi begitu juga jangkaan pengguna dan akses kepada data. Oleh itu, teknologi carian menjadi semakin penting untuk memenuhi jangkaan pengguna dan memberikan pengalaman pengguna yang lebih baik. Carian teks penuh ialah teknologi berkuasa yang boleh mengindeks, mencari dan mengisih sejumlah besar data dengan cepat. Dalam hal ini, Elasticsearch ialah enjin carian sumber terbuka terkemuka yang menyediakan banyak ciri lanjutan serta ketersediaan tinggi, kebolehskalaan mudah dan kelebihan lain. Dalam artikel ini, kami akan memperkenalkan cara menggunakan

Dengan perkembangan berterusan teknologi Internet, pertumbuhan letupan volum data dan aplikasi meluas pelbagai data teks, pengambilan teks penuh telah menjadi teknologi yang sangat penting. Carian teks penuh ialah kaedah yang boleh mencari data teks dengan cepat dan tepat Ia digunakan secara meluas dalam senario aplikasi seperti enjin carian, forum, blog dan tapak web e-dagang. Bagaimana untuk melaksanakan carian teks penuh dalam pengaturcaraan PHP? 1. Apakah carian teks penuh? Dalam pangkalan data hubungan tradisional, kami biasanya menggunakan pernyataan SQL untuk pertanyaan kabur Walau bagaimanapun, apabila jumlah data adalah besar, kaedah pertanyaan ini akan

Gunakan PHP untuk membangunkan dan melaksanakan carian teks penuh dan penapisan kata kunci antara muka API Baidu Wenxin Yiyan Apabila membangunkan aplikasi web, kami selalunya perlu menyepadukan API pihak ketiga ke dalam projek kami untuk menyediakan lebih banyak fungsi dan perkhidmatan. Artikel ini akan memperkenalkan cara menggunakan PHP untuk membangunkan dan melaksanakan carian teks penuh dan fungsi penapisan kata kunci antara muka API Baidu Wenxinyiyan. Baidu Wenxin Yiyan ialah antara muka API yang menyediakan pelbagai kategori ayat Kami boleh melakukan carian teks penuh berdasarkan kata kunci dan penapis kata kunci hasil yang dikembalikan. Pertama, kita
