Rumah Java javaTutorial Cara menggunakan Java untuk melaksanakan fungsi carian teks penuh sistem CMS

Cara menggunakan Java untuk melaksanakan fungsi carian teks penuh sistem CMS

Aug 07, 2023 pm 12:45 PM
java cms Carian teks penuh

Cara menggunakan Java untuk melaksanakan fungsi carian teks penuh sistem CMS

Dalam era Internet moden, sistem pengurusan kandungan (CMS) telah menjadi alat penting untuk banyak syarikat dan tapak web. Dalam sistem CMS yang besar, fungsi carian teks penuh adalah fungsi yang sangat penting. Fungsi carian teks penuh boleh membantu pengguna mendapatkan semula kandungan yang diperlukan dengan cepat dan tepat dan meningkatkan pengalaman pengguna.

Artikel ini akan memperkenalkan cara menggunakan bahasa Java untuk melaksanakan fungsi carian teks penuh sistem CMS, dan menerangkan langkah dan kaedah secara terperinci melalui contoh kod.

Pertama, kita perlu memilih enjin carian teks penuh yang sesuai. Lucene ialah enjin carian teks penuh yang sangat popular dan berkuasa Ia menyediakan fungsi yang kaya dan API yang fleksibel dan sesuai untuk pelbagai senario aplikasi yang berbeza. Dalam artikel ini, kami akan menggunakan Lucene untuk melaksanakan fungsi carian teks penuh.

Langkah pertama ialah memperkenalkan kebergantungan Lucene. Dalam projek Maven, kita boleh menambah kod berikut dalam fail pom.xml:

<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-core</artifactId>
    <version>8.6.3</version>
</dependency>
<dependency>
    <groupId>org.apache.lucene</groupId>
    <artifactId>lucene-analyzers-common</artifactId>
    <version>8.6.3</version>
</dependency>
Salin selepas log masuk

Dalam langkah kedua, kita perlu mencipta indeks. Indeks adalah asas untuk carian teks penuh dan mengandungi dokumen yang dicari dan atributnya. Dalam sistem CMS kami, setiap dokumen boleh mewakili halaman web, artikel atau perenggan teks. Kita boleh mencipta indeks melalui kod berikut:

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.*;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.FSDirectory;

import java.io.IOException;
import java.nio.file.Paths;

public class Indexer {
    private IndexWriter indexWriter;

    public Indexer(String indexDir) throws IOException {
        Analyzer analyzer = new StandardAnalyzer();
        IndexWriterConfig config = new IndexWriterConfig(analyzer);
        FSDirectory directory = FSDirectory.open(Paths.get(indexDir));
        indexWriter = new IndexWriter(directory, config);
    }

    public void index(String content) throws IOException {
        Document doc = new Document();
        doc.add(new TextField("content", content, Field.Store.YES));
        indexWriter.addDocument(doc);
    }

    public void close() throws IOException {
        indexWriter.close();
    }
}
Salin selepas log masuk

Kod di atas mencipta kelas Indexer, yang bertanggungjawab untuk mencipta dan mengurus indeks. Dalam kaedah pembinaan, kami menggunakan kelas StandardAnalyzer untuk membahagikan teks kemudian menggunakan kelas IndexWriterConfig untuk mengkonfigurasi penulis indeks, akhirnya, nyatakan direktori tempat indeks disimpan dan buat objek IndexWriter.

Kaedah indeks menerima kandungan parameter rentetan, yang mewakili kandungan teks yang akan diindeks. Dalam kaedah ini, kita mula-mula mencipta objek Dokumen, kemudian menambah TextField pada objek, dan menggunakan parameter kandungan sebagai nilai Medan. Akhir sekali, dokumen itu ditambahkan pada indeks dengan memanggil kaedah addDocument IndexWriter.

Langkah ketiga, kita perlu melaksanakan fungsi carian. Gunakan kod berikut untuk melaksanakan:

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.*;
import org.apache.lucene.store.FSDirectory;

import java.io.IOException;
import java.nio.file.Paths;

public class Searcher {
    private IndexSearcher indexSearcher;
    private QueryParser queryParser;

    public Searcher(String indexDir) throws IOException {
        IndexReader indexReader = DirectoryReader.open(FSDirectory.open(Paths.get(indexDir)));
        indexSearcher = new IndexSearcher(indexReader);
        Analyzer analyzer = new StandardAnalyzer();
        queryParser = new QueryParser("content", analyzer);
    }

    public TopDocs search(String queryStr, int numResults) throws Exception {
        Query query = queryParser.parse(queryStr);
        return indexSearcher.search(query, numResults);
    }

    public Document getDocument(ScoreDoc scoreDoc) throws IOException {
        return indexSearcher.doc(scoreDoc.doc);
    }
}
Salin selepas log masuk

Kod di atas mencipta kelas Pencari, bertanggungjawab untuk melaksanakan operasi carian. Dalam pembina, kami membuka direktori indeks dan mencipta objek IndexSearcher dan QueryParser. IndexSearcher digunakan untuk melaksanakan operasi carian, dan QueryParser digunakan untuk menghuraikan istilah carian pengguna.

Kaedah carian menerima queryStr parameter rentetan, yang mewakili istilah carian pengguna dan parameter integer numResults, yang mewakili bilangan hasil yang dikembalikan. Dalam kaedah ini, kami mula-mula menggunakan kaedah parse QueryParser untuk menghuraikan istilah carian ke dalam objek Pertanyaan. Kemudian, panggil kaedah carian IndexSearcher untuk melaksanakan operasi carian dan mengembalikan objek TopDocs, yang mengandungi hasil carian.

Kaedah getDocument menerima objek ScoreDoc, yang mewakili dokumen dalam hasil carian. Dengan memanggil kaedah dokumen indexSearcher, kami boleh mendapatkan maklumat terperinci dokumen.

Akhir sekali, kami boleh memanggil kaedah indeks Indexer dalam halaman yang berkaitan sistem CMS untuk menambah dokumen pada indeks, kemudian gunakan kaedah carian Searcher untuk melaksanakan operasi carian, dan dapatkan hasil carian dengan memanggil kaedah getDocument Searcher .

Melalui langkah di atas, kami berjaya melaksanakan fungsi carian teks penuh sistem CMS menggunakan bahasa Java. Menggunakan Lucene sebagai enjin carian, kami boleh mendapatkan semula kandungan yang diperlukan dengan cepat dan tepat dalam sistem CMS yang besar, meningkatkan pengalaman pengguna.

Contoh kod telah disediakan dengan langkah dan arahan terperinci, saya harap ia akan membantu anda!

Atas ialah kandungan terperinci Cara menggunakan Java untuk melaksanakan fungsi carian teks penuh sistem CMS. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Nombor Sempurna di Jawa Nombor Sempurna di Jawa Aug 30, 2024 pm 04:28 PM

Panduan Nombor Sempurna di Jawa. Di sini kita membincangkan Definisi, Bagaimana untuk menyemak nombor Perfect dalam Java?, contoh dengan pelaksanaan kod.

Weka di Jawa Weka di Jawa Aug 30, 2024 pm 04:28 PM

Panduan untuk Weka di Jawa. Di sini kita membincangkan Pengenalan, cara menggunakan weka java, jenis platform, dan kelebihan dengan contoh.

Nombor Smith di Jawa Nombor Smith di Jawa Aug 30, 2024 pm 04:28 PM

Panduan untuk Nombor Smith di Jawa. Di sini kita membincangkan Definisi, Bagaimana untuk menyemak nombor smith di Jawa? contoh dengan pelaksanaan kod.

Soalan Temuduga Java Spring Soalan Temuduga Java Spring Aug 30, 2024 pm 04:29 PM

Dalam artikel ini, kami telah menyimpan Soalan Temuduga Spring Java yang paling banyak ditanya dengan jawapan terperinci mereka. Supaya anda boleh memecahkan temuduga.

Cuti atau kembali dari Java 8 Stream Foreach? Cuti atau kembali dari Java 8 Stream Foreach? Feb 07, 2025 pm 12:09 PM

Java 8 memperkenalkan API Stream, menyediakan cara yang kuat dan ekspresif untuk memproses koleksi data. Walau bagaimanapun, soalan biasa apabila menggunakan aliran adalah: bagaimana untuk memecahkan atau kembali dari operasi foreach? Gelung tradisional membolehkan gangguan awal atau pulangan, tetapi kaedah Foreach Stream tidak menyokong secara langsung kaedah ini. Artikel ini akan menerangkan sebab -sebab dan meneroka kaedah alternatif untuk melaksanakan penamatan pramatang dalam sistem pemprosesan aliran. Bacaan Lanjut: Penambahbaikan API Java Stream Memahami aliran aliran Kaedah Foreach adalah operasi terminal yang melakukan satu operasi pada setiap elemen dalam aliran. Niat reka bentuknya adalah

Terangkan keupayaan carian teks penuh InnoDB. Terangkan keupayaan carian teks penuh InnoDB. Apr 02, 2025 pm 06:09 PM

Keupayaan carian teks penuh InnoDB sangat kuat, yang dapat meningkatkan kecekapan pertanyaan pangkalan data dan keupayaan untuk memproses sejumlah besar data teks. 1) InnoDB melaksanakan carian teks penuh melalui pengindeksan terbalik, menyokong pertanyaan carian asas dan maju. 2) Gunakan perlawanan dan terhadap kata kunci untuk mencari, menyokong mod boolean dan carian frasa. 3) Kaedah pengoptimuman termasuk menggunakan teknologi segmentasi perkataan, membina semula indeks dan menyesuaikan saiz cache untuk meningkatkan prestasi dan ketepatan.

TimeStamp to Date in Java TimeStamp to Date in Java Aug 30, 2024 pm 04:28 PM

Panduan untuk TimeStamp to Date di Java. Di sini kita juga membincangkan pengenalan dan cara menukar cap waktu kepada tarikh dalam java bersama-sama dengan contoh.

Program Java untuk mencari kelantangan kapsul Program Java untuk mencari kelantangan kapsul Feb 07, 2025 am 11:37 AM

Kapsul adalah angka geometri tiga dimensi, terdiri daripada silinder dan hemisfera di kedua-dua hujungnya. Jumlah kapsul boleh dikira dengan menambahkan isipadu silinder dan jumlah hemisfera di kedua -dua hujungnya. Tutorial ini akan membincangkan cara mengira jumlah kapsul yang diberikan dalam Java menggunakan kaedah yang berbeza. Formula volum kapsul Formula untuk jumlah kapsul adalah seperti berikut: Kelantangan kapsul = isipadu isipadu silinder Dua jumlah hemisfera dalam, R: Radius hemisfera. H: Ketinggian silinder (tidak termasuk hemisfera). Contoh 1 masukkan Jejari = 5 unit Ketinggian = 10 unit Output Jilid = 1570.8 Unit padu menjelaskan Kirakan kelantangan menggunakan formula: Kelantangan = π × r2 × h (4

See all articles