选择功能丰富的独立全文搜索服务器:Sphinx 还是 SOLR?
搜索独立全文搜索服务器时- 文本搜索服务器与多个客户端无缝集成,支持通过 SQL 查询进行批量索引,在 Linux 环境中使用 MySQL 运行,并且速度极快性能方面,出现了两个突出的选择:Sphinx 和 SOLR。
相似之处:
- Sphinx 和 SOLR 都满足指定要求,擅长处理大量数据集并且高效索引。
- 他们拥有良好的业绩记录,众多高流量网站利用其功能。
- 这两种选项都提供商业支持。
- 全面的客户端 API 绑定可满足各种平台和语言的需求。
- 可分布式架构提高速度和负载
差异:
- 许可方面区分了 Sphinx 和 SOLR。 Apache2 许可的 SOLR 为商业用途提供了更大的灵活性,而 Sphinx 的 GPLv2 许可证如果集成或扩展超出基本用例,则可能需要商业许可证。
- Java 应用程序中的可嵌入性是 SOLR 的独特优势。
- SOLR 利用长期存在且广泛采用的 Lucene 技术,提供对其最新功能和优化的访问。 Sphinx 提供与 RDBMS(特别是 MySQL)更紧密的集成。
- SOLR 无缝集成用于分布式应用程序开发的 Hadoop 和用于完整 Web 搜索引擎解决方案(包括爬行)的 Nutch。
- SOLR 对专有文件格式的本机支持、拼写检查和多方面搜索使其与 Sphinx 不同。
- Sphinx 缺乏部分更新字段的能力与 SOLR 不同,索引中的数据。
- Sphinx 中的文档键具有不同的要求:唯一的无符号非零整数。 SOLR 提供了更大的灵活性,支持整数和字符串键。
- 字段折叠是一项用于优化搜索结果相关性的功能,在 SOLR 中可用,但在 Sphinx 中不可用。
- SOLR 消除了对通过具有文档检索功能的外部数据存储,节省了额外的请求。
- 两者之间的配置设置有所不同。 Sphinx 需要最少的配置,而 SOLR 使用 Java Web 容器,需要额外的调整。
替代考虑因素:
- ElasticSearch,另一个基于 Lucene 的选项,提供类似的功能,但优点和缺点略有不同。
- Postgresql 和 MySQL 提供全文搜索功能,但可能无法与 Sphinx 或 SOLR 等专用搜索服务器的速度和效率相匹配。
避免使用 Sphinx 的特定场景:
- 使用专有文件格式或需要拼写检查功能时
- 需要多方面的搜索功能
- 需要对字段数据执行部分更新时
- 文档时关键要求不满足Sphinx的非零整数约束
- 字段折叠的情况对于结果优化至关重要
- 当首选直接文档检索而不依赖外部数据存储时
- 当 Sphinx 的简单配置和设置不适合时
以上是Sphinx 或 SOLR:哪个独立全文搜索服务器最能满足我的需求?的详细内容。更多信息请关注PHP中文网其他相关文章!