목차
1. Lucene 라이브러리 소개
2. 인덱스 생성
3. 执行搜索
4. 使用示例
Java java지도 시간 Java에서 전체 텍스트 검색 및 검색을 수행하는 방법

Java에서 전체 텍스트 검색 및 검색을 수행하는 방법

Oct 08, 2023 am 09:31 AM
자바 프로그래밍 전체 텍스트 검색(전체 텍스트 색인) 찾다

Java에서 전체 텍스트 검색 및 검색을 수행하는 방법

Java에서 전체 텍스트 검색 및 검색을 수행하는 방법

전체 텍스트 검색 및 검색은 대규모 텍스트 데이터에서 특정 키워드나 구문을 찾는 기술입니다. 검색 엔진, 이메일 시스템, 문서 관리 시스템 등 대용량 텍스트 데이터를 처리하는 애플리케이션에서는 전체 텍스트 검색 및 검색 기능이 매우 중요합니다.

널리 사용되는 프로그래밍 언어인 Java는 전체 텍스트 검색 및 검색 기능을 구현하는 데 도움이 되는 풍부한 라이브러리와 도구를 제공합니다. 이 기사에서는 Lucene 라이브러리를 사용하여 전체 텍스트 검색 및 검색을 구현하는 방법을 소개하고 몇 가지 구체적인 코드 예제를 제공합니다.

1. Lucene 라이브러리 소개

먼저 프로젝트에 Lucene 라이브러리를 도입해야 합니다. Lucene 라이브러리는 다음과 같은 방법으로 Maven 프로젝트에 도입될 수 있습니다:

<dependencies>
    <dependency>
        <groupId>org.apache.lucene</groupId>
        <artifactId>lucene-core</artifactId>
        <version>8.10.1</version>
    </dependency>
    <dependency>
        <groupId>org.apache.lucene</groupId>
        <artifactId>lucene-analyzers-common</artifactId>
        <version>8.10.1</version>
    </dependency>
</dependencies>
로그인 후 복사

2. 인덱스 생성

전체 텍스트 검색을 수행하기 전에 먼저 인덱스를 생성해야 합니다. 이 인덱스에는 검색할 텍스트 데이터에 대한 관련 정보가 포함되어 있으므로 후속 검색 작업을 수행할 수 있습니다. 다음은 인덱스 생성을 위한 간단한 예제 코드입니다.

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;

import java.io.IOException;
import java.nio.file.Paths;

public class Indexer {
    private IndexWriter indexWriter;

    public Indexer(String indexDir) throws IOException {
        Directory dir = FSDirectory.open(Paths.get(indexDir));
        Analyzer analyzer = new StandardAnalyzer();
        IndexWriterConfig config = new IndexWriterConfig(analyzer);
        indexWriter = new IndexWriter(dir, config);
    }

    public void close() throws IOException {
        indexWriter.close();
    }

    public void addDocument(String content) throws IOException {
        Document doc = new Document();
        doc.add(new TextField("content", content, Field.Store.YES));
        indexWriter.addDocument(doc);
    }
}
로그인 후 복사

위 예제 코드에서는 IndexWriter를 사용하여 인덱스를 생성하고 TextField를 사용하여 필드를 정의합니다. . 인덱스에 색인화할 콘텐츠를 추가할 때 먼저 Document 개체를 생성한 다음 개체에 필드를 추가하고 마지막으로 addDocument 메서드를 호출하여 < code>문서 객체가 색인에 추가됩니다. IndexWriter来创建索引,并使用TextField来定义要索引的字段。将要索引的内容添加到索引中时,我们需要先创建一个Document对象,然后将字段添加到该对象中,最后调用addDocument方法将Document对象添加到索引中。

3. 执行搜索

创建完索引后,我们就可以进行搜索操作了。以下是一个简单的搜索示例代码:

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;

import java.io.IOException;
import java.nio.file.Paths;

public class Searcher {
    private IndexSearcher indexSearcher;
    private QueryParser queryParser;

    public Searcher(String indexDir) throws IOException {
        Directory dir = FSDirectory.open(Paths.get(indexDir));
        Analyzer analyzer = new StandardAnalyzer();
        IndexReader indexReader = DirectoryReader.open(dir);
        indexSearcher = new IndexSearcher(indexReader);
        queryParser = new QueryParser("content", analyzer);
    }

    public ScoreDoc[] search(String queryString, int numResults) throws Exception {
        Query query = queryParser.parse(queryString);
        TopDocs topDocs = indexSearcher.search(query, numResults);
        return topDocs.scoreDocs;
    }

    public Document getDocument(int docID) throws IOException {
        return indexSearcher.doc(docID);
    }
}
로그인 후 복사

在上面的示例代码中,我们使用IndexSearcher来执行搜索操作。在执行搜索之前,我们需要先创建一个Query对象来表示要搜索的查询,并使用QueryParser来解析查询字符串为Query对象。然后,我们使用IndexSearchersearch方法执行搜索,并返回搜索结果的排名。

4. 使用示例

下面是一个使用全文检索和搜索功能的示例代码:

public class Main {
    public static void main(String[] args) {
        String indexDir = "/path/to/index/dir";
        
        try {
            Indexer indexer = new Indexer(indexDir);
            indexer.addDocument("Hello, world!");
            indexer.addDocument("Java is a programming language.");
            indexer.addDocument("Lucene is a full-text search engine.");
            indexer.close();

            Searcher searcher = new Searcher(indexDir);
            ScoreDoc[] results = searcher.search("Java", 10);
            for (ScoreDoc result : results) {
                Document doc = searcher.getDocument(result.doc);
                System.out.println(doc.getField("content").stringValue());
            }
        } catch (IOException e) {
            e.printStackTrace();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}
로그인 후 복사

在上面的示例代码中,我们首先创建一个Indexer来创建索引,并添加一些文本数据。然后,我们创建一个Searcher

3. 검색 수행

인덱스를 생성한 후 검색 작업을 수행할 수 있습니다. 다음은 간단한 검색 예시 코드입니다. 🎜rrreee🎜위 예시 코드에서는 IndexSearcher를 사용하여 검색 작업을 수행합니다. 검색을 수행하기 전에 검색할 쿼리를 나타내는 Query 개체를 생성하고 QueryParser를 사용하여 쿼리 문자열을 Query)로 구문 분석해야 합니다. > 개체. 그런 다음 IndexSearchersearch 메서드를 사용하여 검색을 수행하고 검색 결과의 순위를 반환합니다. 🎜🎜4. 사용 예🎜🎜다음은 전체 텍스트 검색 및 검색 기능을 사용하는 샘플 코드입니다. 🎜rrreee🎜위 샘플 코드에서는 먼저 Indexer를 생성하여 인덱스를 생성합니다. , 일부 텍스트 데이터를 추가합니다. 그런 다음 검색을 수행하고 검색 결과의 텍스트 내용을 인쇄하는 Searcher를 만듭니다. 🎜🎜위의 샘플 코드를 통해 Lucene 라이브러리를 사용하여 Java에서 전체 텍스트 검색 및 검색 기능을 쉽게 구현할 수 있습니다. Lucene을 사용하면 대규모 텍스트 데이터에서 특정 키워드나 문구를 효율적으로 찾을 수 있으므로 텍스트 처리 애플리케이션의 효율성과 성능이 향상됩니다. 🎜

위 내용은 Java에서 전체 텍스트 검색 및 검색을 수행하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Java에서 전체 텍스트 검색 및 검색을 수행하는 방법 Java에서 전체 텍스트 검색 및 검색을 수행하는 방법 Oct 08, 2023 am 09:31 AM

Java에서 전체 텍스트 검색 및 검색을 수행하는 방법 전체 텍스트 검색 및 검색은 대규모 텍스트 데이터에서 특정 키워드나 구문을 찾는 기술입니다. 검색 엔진, 이메일 시스템, 문서 관리 시스템 등 대용량 텍스트 데이터를 처리하는 애플리케이션에서는 전체 텍스트 검색 및 검색 기능이 매우 중요합니다. 널리 사용되는 프로그래밍 언어인 Java는 전체 텍스트 검색 및 검색 기능을 구현하는 데 도움이 되는 풍부한 라이브러리와 도구를 제공합니다. 이 기사에서는 Lucene 라이브러리를 사용하여 전체 텍스트 검색 및 검색을 구현하는 방법을 소개하고

ChatGPT Java: 지능형 코드 생성 및 최적화를 달성하는 방법 ChatGPT Java: 지능형 코드 생성 및 최적화를 달성하는 방법 Oct 24, 2023 pm 12:18 PM

ChatGPTJava: 지능형 코드 생성 및 최적화 구현 방법 소개: 인공 지능 기술의 급속한 발전으로 지능형 코드 생성 및 최적화가 프로그래밍 분야에서 뜨거운 주제가 되었습니다. ChatGPT는 자연어와 기계 간의 상호 작용을 가능하게 하는 OpenAI 기반의 강력한 언어 모델입니다. 이 기사에서는 ChatGPT를 사용하여 지능형 코드 생성 및 최적화 작업을 구현하는 방법을 소개하고 몇 가지 구체적인 코드 예제를 제공합니다. 1. 지능형 코드 생성: ChatGPT를 사용하여 지능형 코드 생성 구축

Java 명명 규칙을 따라야 하는 이유는 무엇입니까? Java 명명 규칙을 따라야 하는 이유는 무엇입니까? Sep 19, 2023 pm 01:57 PM

Java 명명 규칙을 사용하면 프로그램을 더 쉽게 읽을 수 있으므로 프로그램을 더 쉽게 이해할 수 있습니다. Java에서 클래스 이름은 일반적으로 명사여야 하며 제목 형식은 대문자로 시작하고 각 단어의 첫 글자는 대문자여야 합니다. 인터페이스 이름은 일반적으로 제목 형식의 형용사여야 하며 대문자로 시작하고 각 단어의 첫 글자는 대문자여야 합니다. Java 명명 표준을 따라야 하는 이유 소스 코드를 읽고 이해하는 데 필요한 노력을 줄입니다. 코드 검토를 통해 구문 및 명명 표준보다 더 중요한 문제에 집중할 수 있습니다. 코드 품질 검토 도구를 사용하여 구문 및 스타일 선호도보다는 중요한 문제에 주로 집중할 수 있습니다. 다양한 유형 식별자에 대한 명명 규칙 패키지 이름은 모두 소문자여야 합니다. 예 packagecom.tutorialspoint;인터페이스 인터페이스 이름은 대문자여야 합니다.

Java 데이터 형식 예외(DataFormatException)를 해결하는 방법 Java 데이터 형식 예외(DataFormatException)를 해결하는 방법 Aug 27, 2023 am 10:14 AM

Java 데이터 형식 예외(DataFormatException) 해결 방법 Java 프로그래밍에서는 다양한 비정상적인 상황이 자주 발생합니다. 그 중 데이터 형식 예외(DataFormatException)는 일반적이지만 매우 어려운 문제입니다. 이 예외는 입력 데이터가 지정된 형식 요구 사항을 충족할 수 없는 경우 발생합니다. 이 이상 현상을 해결하려면 특정 기술과 경험이 필요합니다. 이 문서에서는 Java 데이터 형식 예외를 해결하는 방법을 자세히 설명하고 몇 가지 코드 예제를 제공합니다.

ChatGPT Java: 지능형 정보 추출 및 구조화된 처리를 구현하는 방법 ChatGPT Java: 지능형 정보 추출 및 구조화된 처리를 구현하는 방법 Oct 28, 2023 am 10:00 AM

ChatGPTJava: 지능형 정보 추출 및 구조화된 처리를 구현하는 방법, 구체적인 코드 예제가 필요합니다. 소개: 인공 지능 기술의 급속한 발전으로 인해 지능형 정보 추출 및 구조화된 처리가 데이터 처리 분야에서 점점 더 중요한 역할을 하고 있습니다. 이 기사에서는 ChatGPTJava를 사용하여 지능형 정보 추출 및 구조화된 처리 기능을 구현하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 1. 지능형 정보 추출 지능형 정보 추출은 비정형 데이터에서 핵심 정보를 추출하는 과정을 말합니다. 인자

Java를 사용하여 기수 정렬 알고리즘을 구현하는 방법 Java를 사용하여 기수 정렬 알고리즘을 구현하는 방법 Sep 19, 2023 pm 03:39 PM

Java를 사용하여 기수 정렬 알고리즘을 구현하는 방법은 무엇입니까? 기수 정렬 알고리즘은 비트 값을 기준으로 요소를 정렬하는 비비교 정렬 알고리즘입니다. 핵심 아이디어는 단위, 십, 백 및 기타 숫자에 따라 정렬할 숫자를 그룹화한 다음 각 숫자를 차례로 정렬하여 최종적으로 정렬된 시퀀스를 얻는 것입니다. 다음에서는 Java를 사용하여 기수 정렬 알고리즘을 구현하는 방법을 자세히 소개하고 코드 예제를 제공합니다. 먼저 기수 정렬 알고리즘은 정렬할 숫자를 저장하기 위해 2차원 배열을 준비해야 합니다. 배열의 행 수는 비트 수에 따라 결정됩니다. 예를 들어

Java에서 배열에 새 요소를 추가하는 방법은 무엇입니까? Java에서 배열에 새 요소를 추가하는 방법은 무엇입니까? Jan 03, 2024 pm 03:30 PM

배열에 새 요소를 추가하는 것은 Java에서 일반적인 작업이며 다양한 방법을 사용하여 수행할 수 있습니다. 이 문서에서는 배열에 요소를 추가하는 몇 가지 일반적인 방법을 소개하고 해당 코드 예제를 제공합니다. 1. 새 배열을 사용하는 일반적인 방법은 새 배열을 만들고 원래 배열의 요소를 새 배열에 복사한 다음 새 배열의 끝에 새 요소를 추가하는 것입니다. 구체적인 단계는 다음과 같습니다. 원래 배열보다 크기가 1 더 큰 새 배열을 만듭니다. 새로운 요소가 추가되기 때문입니다. 원래 배열의 요소를 새 배열에 복사합니다. 새 배열의 끝에 추가

Java 스위치 식료품 쇼핑 시스템에서 소셜 공유 기능을 구현하는 방법 Java 스위치 식료품 쇼핑 시스템에서 소셜 공유 기능을 구현하는 방법 Nov 01, 2023 pm 05:15 PM

소셜 공유 기능을 갖춘 Java 스위치 식료품 쇼핑 시스템을 구현하는 방법 기술의 발전과 소셜 미디어의 인기로 인해 점점 더 많은 사람들이 쇼핑할 때 구매 경험과 생각을 공유하는 데 익숙해졌습니다. 좋은 쇼핑 시스템은 사용자의 요구를 충족시키기 위해 편리하고 빠르게 구매를 완료해야 할 뿐만 아니라 소셜 공유 기능도 제공해야 합니다. 이 기사에서는 소셜 공유 기능을 갖춘 Java 스위치 식료품 쇼핑 시스템을 구현하는 방법을 소개합니다. 먼저, 구현할 소셜 공유 채널을 결정해야 합니다. 일반적인 채널로는 WeChat, Weibo, QQ 등이 있습니다. Java에서는 세 번째를 사용할 수 있습니다.

See all articles