Asfafasfasfasfasf
Artikel ini meneroka RAG Agentik, pendekatan yang kuat menggabungkan pengambilan keputusan Agentic AI dengan penyesuaian RAG untuk mendapatkan semula maklumat dan generasi dinamik. Tidak seperti model tradisional yang terhad oleh data latihan, Agentic RAG secara bebas mengakses dan alasan dengan maklumat dari pelbagai sumber. Panduan praktikal ini memberi tumpuan kepada membina saluran paip RAG berasaskan Langchain.
Projek RAG Agentik: Panduan Langkah demi Langkah
Projek ini membina saluran paip RAG berikutan seni bina ini:
-
pertanyaan pengguna: Proses bermula dengan soalan pengguna.
-
Routing pertanyaan: Sistem menentukan jika ia dapat menjawab menggunakan pengetahuan yang ada. Jika ya, ia bertindak balas secara langsung; Jika tidak, ia meneruskan pengambilan data.
-
Pengambilan data: Paip mengakses dua sumber yang berpotensi:
- Dokumen tempatan: PDF pra-diproses (prinsip AI generatif) berfungsi sebagai asas pengetahuan.
- Carian Internet: Untuk konteks yang lebih luas, sistem menggunakan sumber luaran melalui pengikis web.
-
Bangunan konteks: Data yang diambil disusun menjadi konteks yang koheren.
-
Generasi Jawapan: Konteks ini diberi kepada model bahasa yang besar (LLM) untuk menghasilkan jawapan yang ringkas dan tepat.
Menyediakan persekitaran
Prasyarat:
- kekunci API Groq (
- ) Gemini API Key ( Gemini API Console
- ) Serper.dev API Key ( Serper.Dev API Key
- )
Pasang pakej python yang diperlukan:
pip install langchain-groq faiss-cpu crewai serper pypdf2 python-dotenv setuptools sentence-transformers huggingface distutils
Kekunci API Simpan dengan selamat dalam fail (contoh di bawah):
.env
import os from dotenv import load_dotenv # ... other imports ... load_dotenv() GROQ_API_KEY = os.getenv("GROQ_API_KEY") SERPER_API_KEY = os.getenv("SERPER_API_KEY") GEMINI = os.getenv("GEMINI")
Kod ini menggunakan beberapa komponen Langchain:
untuk pangkalan data vektor, untuk pemprosesan PDF, FAISS
untuk chunking teks, PyPDFLoader
untuk penyembuhan generasi, RecursiveCharacterTextSplitter
dan HuggingFaceEmbeddings
untuk LLMS, ChatGroq
Dua LLMS dimulakan: llm
(Llama-3.3-70B-SPECDEC) untuk tugas umum dan crew_llm
(Gemini/Gemini-1.5-flash) untuk mengikis web. A check_local_knowledge()
fungsi laluan pertanyaan berdasarkan ketersediaan konteks setempat. Ejen mengikis web, dibina menggunakan crewai
, mengambil semula dan meringkaskan kandungan web. Pangkalan data vektor dibuat dari PDF menggunakan Faiss. Akhirnya, generate_final_answer()
menggabungkan konteks dan pertanyaan untuk menghasilkan tindak balas akhir.
Penggunaan dan output contoh:
Fungsi main()
menunjukkan pertanyaan sistem. Sebagai contoh, pertanyaan "Apa itu Rag Agentic?" mencetuskan mengikis web, mengakibatkan penjelasan komprehensif mengenai Rag Agentik, komponen, faedah, dan batasannya. Output mempamerkan keupayaan sistem untuk mengakses dan mensintesis maklumat secara dinamik dari pelbagai sumber. Output terperinci ditinggalkan di sini untuk keringkasan tetapi boleh didapati dalam input asal.
Atas ialah kandungan terperinci Asfafasfasfasfasf. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Semasa bekerja pada AIS AI, pemaju sering mendapati diri mereka menavigasi perdagangan antara kelajuan, fleksibiliti, dan kecekapan sumber. Saya telah meneroka rangka kerja AI yang agentik dan menjumpai Agno (sebelum ini adalah Phi-

Pelepasan ini termasuk tiga model yang berbeza, GPT-4.1, GPT-4.1 Mini dan GPT-4.1 Nano, menandakan langkah ke arah pengoptimuman khusus tugas dalam landskap model bahasa yang besar. Model-model ini tidak segera menggantikan antara muka yang dihadapi pengguna seperti

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

Buka kunci kekuatan model embedding: menyelam jauh ke kursus baru Andrew Ng Bayangkan masa depan di mana mesin memahami dan menjawab soalan anda dengan ketepatan yang sempurna. Ini bukan fiksyen sains; Terima kasih kepada kemajuan dalam AI, ia menjadi R

Simulasi Rocket dilancarkan dengan Rocketpy: Panduan Komprehensif Artikel ini membimbing anda melalui mensimulasikan pelancaran roket kuasa tinggi menggunakan Rocketpy, perpustakaan Python yang kuat. Kami akan merangkumi segala -galanya daripada menentukan komponen roket untuk menganalisis simula

Gemini sebagai asas strategi AI Google Gemini adalah asas kepada strategi ejen AI Google, memanfaatkan keupayaan multimodalnya untuk memproses dan menjana respons di seluruh teks, imej, audio, video dan kod. Dibangunkan oleh DeepM

"Super gembira untuk mengumumkan bahawa kami memperoleh robotik debunga untuk membawa robot sumber terbuka ke dunia," kata Hugging Face pada X. "Sejak Remi Cadene menyertai kami dari Tesla, kami telah menjadi platform perisian yang paling banyak digunakan untuk robot terbuka terima kasih

Dalam perkembangan penting bagi komuniti AI, Agentica dan bersama-sama AI telah mengeluarkan model pengekodan AI sumber terbuka bernama DeepCoder-14b. Menawarkan keupayaan penjanaan kod setanding dengan pesaing sumber tertutup seperti OpenAI
