参考:/a/1190000002497183
需求跟这个是类似的 要求是能全文检索(当然是中文全文) 放进去什么就能原样拿出来什么
现在的问题是 lucene也可以在索引的时候保持原字段内容
那么综合
*性能(不超过200次/s查询)、
*更新(希望数据更新后立刻能反映出来,但是检索可以延迟)、
*数据量(小于千万级,每条数据不会上M)
*扩展性(多源、每个源的格式、字段不太一样)
的考虑,需不需要把这个原始的数据存到数据库里 然后lucene只留一个主键,还是直接从lucene还原原始数据更好呢
以前做过类似项目是在mongo里存原始内容 没太考虑过这些
It is recommended to refer to the implementation of elasticsearch
I have only used Solr, but I feel that the idea should be to only use Lucene for indexing, and the storage should be placed on mogondb. Every time I query Lucene, I first query Lucene, and then get the data from mongodb according to the primary key