정보가 매우 복잡한 인터넷 시대에 우리는 검색 엔진의 강력한 도구를 사용하여 원하는 정보를 찾는 방법을 배웠습니다. 예를 들어 발렌타인 데이에 여자 친구를 기쁘게 하는 방법을 Google에서 검색하게 됩니다. Baidu에서 합법적인 성형외과를 검색해 보세요(광고 사기꾼이 많이 있지만). 따라서 사용자가 직접 개발한 웹 사이트 시스템에서 일부 중요한 정보를 검색할 수 있도록 하고 구조화된 결과를 사용자에게 제공해야 하는 경우 아래에 공유된 9가지 Java 검색 엔진 프레임워크가 도움이 될 수 있습니다.
1. Java 전체 텍스트 검색 엔진 프레임워크 Lucene
Lucene은 현재 가장 널리 사용되는 Java 전체 텍스트 검색 프레임워크임에는 의심의 여지가 없습니다. 완전한 쿼리 엔진과 인덱싱 엔진, 그리고 텍스트 분석 엔진의 일부를 제공하는 검색 엔진 아키텍처입니다. Lucene은 개발자에게 강력한 전체 텍스트 검색 기능을 쉽게 구현할 수 있는 상당히 완전한 도구 키트를 제공합니다. 아래에는 Lucene을 기반으로 구현된 여러 검색 엔진 프레임워크가 있습니다.
공식 홈페이지 : http://lucene.apache.org/
2. 오픈소스 Java 검색엔진 Nutch
Nutch는 오픈소스 Java로 구현된 검색엔진입니다. 이는 자체 검색 엔진을 실행하는 데 필요한 모든 도구를 제공합니다. 전체 텍스트 검색 및 웹 크롤링이 포함됩니다.
Nutch를 사용하면 다음 기능을 수행할 수 있습니다.
매월 수십억 개의 웹 페이지 가져오기
이러한 웹 페이지에 대한 색인 유지
예 색인 초당 수천 건의 검색이 가능한 파일
고품질 검색 결과 제공
최소 비용으로 운영
공식 웹사이트: http://nutch.apache/
3. 분산 검색 엔진 ElasticSearch
ElasticSearch는 Lucene 프레임워크 기반의 분산 검색 엔진으로, 인덱싱을 위해 JSON을 기반으로 하는 몇 안 되는 검색 엔진 중 하나이기도 합니다. ElasticSearch는 특히 클라우드 컴퓨팅 플랫폼에서 사용하기에 적합합니다.
공식 홈페이지 : http://www.elasticsearch.org/
4. 실시간 분산 검색 엔진 Solandra
Solandra는 실시간 분산 검색 엔진 기반의 Apache Solr 및 Apache Cassandra 빌드.
기능은 다음과 같습니다.
Solr의 기본 기능 대부분 지원(검색, 패싯, 하이라이트)
데이터 복제, 샤딩, 캐싱 및 압축은 모두 Cassandra에서 제공됩니다.
멀티 마스터 수행(모든 노드를 읽고 쓸 수 있음)
높은 실시간 성능, 쓰기 작업이 완료되는 즉시 읽기
새로운 SolrCore를 쉽게 추가 클러스터 전체를 다시 시작하지 않고도 쉽게 노드를 추가하고 다시 시작할 수 있습니다
공식 웹사이트: https://github.com/tjake/Solandra
5. IndexTank
IndexTank는 Java 인덱스 세트 - 실시간 전체 텍스트 검색 엔진 구현인 IndexTank에는 다음 기능이 있습니다.
인덱스 업데이트가 실시간으로 적용됩니다
지리적 위치 검색
지원 다양한 클라이언트 언어
Ruby, Rails, Python, Java, PHP, .NET 등!
유연한 정렬 및 채점 제어 지원
자동 완성 지원
지원 패싯 검색 )
일치 강조 지원
대규모 데이터 확장 지원(개인 블로그에서 수억 문서까지 확장 가능! )
동적 데이터 지원
공식홈페이지 : https://github.com/linkedin/indextank-engine
6. 검색엔진 Compass
Compass는 강력하고 트랜잭션이 가능한 고성능 개체/검색 엔진 매핑(OSEM: 개체/검색 엔진 매핑)이며 Java 지속성 계층 프레임워크에는 다음이 포함됩니다.
검색 엔진 추상화 계층( Lucene 사용) 검색 추천)
OSEM(Object/Search Engine Mapping)은
트랜잭션 관리
지원 Google
과 유사한 간단한 키워드 쿼리 언어 사용 가능 확장 및 모듈화 Framework
Simple API
공식 홈페이지: http://www.compass-project.org/
7. Java 전체 텍스트 검색 서버 Solr
Solr 역시 Java를 기반으로 구현되었으며 Lucene을 기반으로 구현되었습니다. Solr의 주요 기능은 효율적이고 유연한 캐싱 기능, 수직 검색 기능, 강조된 검색 결과입니다. Solr가 색인된 데이터를 관리하기 위한 훌륭한 웹 인터페이스도 제공한다는 점은 주목할 가치가 있습니다.
공식 홈페이지: http://lucene.apache.org/solr/
8. Lucene 이미지 검색 LIRE
LIRE는 Java 기반 이미지 검색 프레임워크입니다. core도 Lucene을 기반으로 하며, 이 인덱스를 사용하면 유사한 이미지를 검색하는 CBIR(콘텐츠 기반 이미지 검색) 시스템을 구축할 수 있습니다.
공식 홈페이지: http://www.semanticmetadata.net/lire/
9. 전체 텍스트 검색 엔진 Egothor
Egothor는 오픈 소스이자 효율적인 도구로 작성된 것입니다. Java 전체 텍스트 검색 엔진에서. Java의 크로스 플랫폼 기능을 통해 Egothor는 모든 환경의 애플리케이션에 적용할 수 있으며 별도의 검색 엔진으로 구성하거나 전체 텍스트 검색을 위해 애플리케이션에서 사용할 수 있습니다.
공식 홈페이지: http://www.egothor.org/cms/