参考:/a/1190000002497183
需求跟这个是类似的 要求是能全文检索(当然是中文全文) 放进去什么就能原样拿出来什么
现在的问题是 lucene也可以在索引的时候保持原字段内容
那么综合
*性能(不超过200次/s查询)、
*更新(希望数据更新后立刻能反映出来,但是检索可以延迟)、
*数据量(小于千万级,每条数据不会上M)
*扩展性(多源、每个源的格式、字段不太一样)
的考虑,需不需要把这个原始的数据存到数据库里 然后lucene只留一个主键,还是直接从lucene还原原始数据更好呢
以前做过类似项目是在mongo里存原始内容 没太考虑过这些
Elasticsearch 구현을 참고하시면 좋습니다
Solr만 사용해봤는데, 인덱싱은 Lucene만 사용하고, 저장소는 mogondb에 두어야 한다는 생각이 듭니다. Lucene을 쿼리할 때마다 Lucene을 먼저 쿼리한 다음, mogondb에서 데이터를 가져옵니다. 기본 키에 따른 mongodb