第一次尝试用sphinx来做全文搜索,可能有很多见解都不是很正确。有不同的想法,大家可以提出来。
现在版本的sphinx不知道支不支持中文了,问了群里的朋友都说不支持,所有用了以下的这种方法来做。
1、文章的处理。
假如文章表为article_main
id | title | summary | content | time |
1 | 测试的标题 | 测试的摘要 | 测试的内容 | 123123123 |
由于sphinx不支持中文(真的吗?这里当它是吧)
我们新建立一个表article_unicode
id | article_id | title | summary | content | time |
1 | 1 | 23243 23123 12213 | 12312 12312 12345 | 12312 12312 12345 | 123123123 |
这个新的表的结构和article_main的内容是一样的,但是储存的是中文的utf-8的unicode码。
这样我们在增加文章的时候同时把输入的标题、摘要、内容处理成utf-8的unicode码,然后再保存到article_unicode表中。
在配置sphinx的时候再以article_unicode这个表作为源(见:http://my.oschina.net/ptk/blog/495435 )
2、所用到的处理utf-8 unicode的类有如下:
1 |
|
调用方法如下:
1 |
|
然后保存到表中。
3、当我们作搜索的时候,同样的先把搜索词转化为unicode码,再用这个码来作sphinx的搜索
1 |
|
这样就可以了。