Rumah pembangunan bahagian belakang Tutorial Python Saya Perpustakaan Sumber Terbuka Untuk Membina Carian RAG, Ejen & AI

Saya Perpustakaan Sumber Terbuka Untuk Membina Carian RAG, Ejen & AI

Nov 29, 2024 pm 04:10 PM

Apakah itu Retrieval Augmented Generation (RAG)?

Retrieval Augmented Generation (RAG) ialah teknik AI yang menggabungkan pencarian maklumat yang berkaitan dengan menjana respons. Ia berfungsi dengan mula-mula mendapatkan semula data daripada sumber luaran (seperti dokumen atau pangkalan data) dan kemudian menggunakan maklumat ini untuk mencipta jawapan yang lebih tepat dan memahami konteks. Ini membantu AI memberikan respons berasaskan fakta yang lebih baik dan bukannya bergantung semata-mata pada perkara yang dilatihnya.

Bagaimanakah Retrieval Augmented Generation (RAG) Berfungsi?

RAG (Retrieval-Augmented Generation) berfungsi dengan mempertingkatkan respons AI dengan maklumat berkaitan daripada sumber luaran. Berikut ialah penjelasan ringkas:

  1. Apabila pengguna bertanya soalan, RAG mencari melalui pelbagai sumber data (seperti pangkalan data, tapak web dan dokumen) untuk mencari maklumat yang berkaitan.
  2. Ia kemudian menggabungkan maklumat yang diambil ini dengan soalan asal untuk membuat gesaan yang lebih termaklum.
  3. Gesaan dipertingkat ini dimasukkan ke dalam model bahasa, yang menjana respons yang berkaitan dengan soalan dan diperkaya dengan maklumat yang diambil. Proses ini membolehkan AI memberikan jawapan yang lebih tepat, terkini dan peka konteks dengan memanfaatkan sumber pengetahuan luaran di samping keupayaan terlatihnya.

I Open Source Libraries To Build RAG, Agents & AI Search

Bagaimanakah Retrieval Augmented Generation (RAG) membantu Model AI?

RAG menjadikan AI lebih dipercayai dan terkini dengan menambah pengetahuan dalamannya dengan data luaran dunia sebenar. RAG juga menambah baik model AI dalam beberapa cara utama:

  1. Akses kepada Maklumat Terkini: RAG mendapatkan semula maklumat masa nyata yang berkaitan daripada sumber luaran (seperti dokumen, pangkalan data atau web). Ini bermakna AI boleh memberikan respons yang tepat walaupun data latihannya sudah lapuk.
  2. Ketepatan Dipertingkat: Daripada bergantung semata-mata pada pengetahuan terlatih AI, RAG memastikan model menjana respons berdasarkan data yang paling berkaitan. Ini menjadikan jawapan lebih tepat dan berdasarkan fakta.
  3. Pemahaman Kontekstual yang Lebih Baik: Dengan menggabungkan data yang diperoleh semula dengan pertanyaan pengguna, RAG boleh menawarkan jawapan yang lebih memahami konteks, menjadikan respons AI berasa lebih disesuaikan dan khusus kepada situasi.
  4. Halusinasi Berkurangan: Model AI tulen kadangkala "berhalusinasi" atau membuat maklumat. RAG mengurangkan perkara ini dengan mengasaskan respons dalam fakta, data yang diperoleh semula, mengurangkan kemungkinan maklumat yang tidak tepat atau rekaan.

7 Perpustakaan Sumber Terbuka untuk melakukan Retrieval Augmented Generation

Mari kita terokai beberapa perpustakaan sumber terbuka yang membantu anda melakukan RAG. Perpustakaan ini menyediakan alatan dan rangka kerja yang diperlukan untuk melaksanakan sistem RAG dengan cekap, daripada pengindeksan dokumen kepada pengambilan dan penyepaduan dengan model bahasa.

1. PUTAR

I Open Source Libraries To Build RAG, Agents & AI Search

SWIRL ialah perisian infrastruktur AI sumber terbuka yang memperkasakan aplikasi Retrieval-Augmented Generation (RAG). Ia meningkatkan saluran paip AI dengan mendayakan carian pantas dan selamat merentas sumber data tanpa mengalihkan atau menyalin data. SWIRL berfungsi di dalam tembok api anda, memastikan keselamatan data sambil mudah dilaksanakan.

Apa yang menjadikannya unik:

  • Tiada ETL atau pergerakan data diperlukan.
  • Pengaturan AI yang pantas dan selamat di dalam awan peribadi.
  • Penyepaduan lancar dengan lebih 20 model bahasa besar (LLM).
  • Dibina untuk akses dan pematuhan data yang selamat.
  • Menyokong pengambilan data daripada 100 aplikasi.

⭐️ SWIRL pada GitHub

2. Cognita

I Open Source Libraries To Build RAG, Agents & AI Search

Cognita ialah rangka kerja sumber terbuka untuk membina sistem Penjanaan Ditambah Penghasilan (RAG) modular, sedia pengeluaran. Ia menyusun komponen RAG, menjadikannya lebih mudah untuk diuji secara tempatan dan digunakan pada skala. Ia menyokong pelbagai pengambilan semula dokumen, pembenaman dan dipacu API sepenuhnya, membolehkan penyepaduan yang lancar ke dalam sistem lain.

Apa yang menjadikannya unik:

  • Reka bentuk modular untuk sistem RAG berskala.
  • UI untuk pengguna bukan teknikal untuk berinteraksi dengan dokumen dan Soal Jawab.
  • Pengindeksan tambahan mengurangkan beban pengiraan dengan menjejaki perubahan.

⭐️ Cognita pada GitHub

3. LLM-Ware

I Open Source Libraries To Build RAG, Agents & AI Search

LLM Ware ialah rangka kerja sumber terbuka untuk membina saluran paip Retrieval Augmented Generation (RAG) yang sedia untuk perusahaan. Ia direka bentuk untuk menyepadukan model kecil dan khusus yang boleh digunakan secara peribadi dan selamat, menjadikannya sesuai untuk aliran kerja perusahaan yang kompleks.

Apa yang menjadikannya unik:

  • Menawarkan 50 model kecil yang diperhalusi yang dioptimumkan untuk tugas perusahaan.
  • Menyokong seni bina RAG modular dan boleh skala.
  • Boleh berjalan tanpa GPU, membolehkan penggunaan ringan.

⭐️ LLMWare di GitHub

4. Aliran RAG

I Open Source Libraries To Build RAG, Agents & AI Search

RagFlow ialah enjin sumber terbuka yang memfokuskan pada Retrieval Augmented Generation (RAG) menggunakan pemahaman dokumen yang mendalam. Ia membolehkan pengguna menyepadukan data berstruktur dan tidak berstruktur untuk jawapan soalan berasaskan petikan yang berkesan. Sistem ini menawarkan seni bina berskala dan modular dengan pilihan penggunaan yang mudah.

Apa yang menjadikannya unik:

  • Pemahaman dokumen mendalam terbina dalam untuk mengendalikan format data yang kompleks.
  • Petikan berdasarkan asas dengan mengurangkan risiko halusinasi.
  • Sokongan untuk pelbagai jenis dokumen seperti PDF, imej dan data berstruktur.

⭐️ Aliran RAG di GitHub

5. Graf RAG

I Open Source Libraries To Build RAG, Agents & AI Search

GraphRAG ialah sistem Retrieval-Augmented Generation (RAG) berasaskan graf yang direka bentuk untuk meningkatkan output LLM dengan menggabungkan graf pengetahuan berstruktur. Ia menyokong penaakulan lanjutan dengan data peribadi, menjadikannya sesuai untuk perusahaan dan aplikasi penyelidikan.

Apa yang menjadikannya unik:

  • Menggunakan graf pengetahuan untuk menstruktur dan mempertingkatkan pengambilan data.
  • Disesuaikan untuk kes penggunaan perusahaan kompleks yang memerlukan pengendalian data peribadi.
  • Menyokong penyepaduan dengan Microsoft Azure untuk penggunaan berskala besar.

? Graf RAG pada GitHub

6. Timbunan jerami

I Open Source Libraries To Build RAG, Agents & AI Search

Haystack ialah rangka kerja orkestrasi AI sumber terbuka untuk membina aplikasi LLM sedia pengeluaran. Ia membenarkan pengguna menyambungkan model, pangkalan data vektor dan penukar fail untuk mencipta sistem lanjutan seperti RAG, menjawab soalan dan carian semantik.

Apa yang menjadikannya unik:

  • Saluran paip yang fleksibel untuk mendapatkan semula, membenamkan dan tugasan inferens.
  • Menyokong integrasi dengan pelbagai pangkalan data vektor dan LLM.
  • Boleh disesuaikan dengan kedua-dua model di luar rak dan ditala halus.

? Timbunan jerami pada GitHub

7. Ribut

I Open Source Libraries To Build RAG, Agents & AI Search

STORM ialah sistem penyusunan pengetahuan dikuasakan LLM yang menyelidik topik dan menjana laporan penuh dengan petikan. Ia menyepadukan kaedah mendapatkan semula lanjutan dan menyokong soalan berbilang perspektif, mempertingkatkan kedalaman dan ketepatan kandungan yang dijana.

Apa yang menjadikannya unik:

  • Menghasilkan artikel seperti Wikipedia dengan petikan berasas.
  • Menyokong penyusunan pengetahuan AI manusia secara kolaboratif.
  • Reka bentuk modular dengan sokongan untuk sumber perolehan luaran.

? Ribut di GitHub

Cabaran dalam Retrieval Augmented Generation

Retrieval Augmented Generation (RAG) menghadapi cabaran seperti memastikan perkaitan data, mengurus kependaman dan mengekalkan kualiti data. Beberapa cabaran ialah:

  • Perkaitan data: Memastikan dokumen yang diambil sangat berkaitan dengan pertanyaan boleh menjadi sukar, terutamanya dengan set data yang besar atau bising.
  • Latensi: Mencari sumber luaran menambah overhed, berpotensi memperlahankan masa tindak balas, terutamanya dalam aplikasi masa nyata.
  • Kualiti data: Data berkualiti rendah atau lapuk boleh membawa kepada respons yang dijana AI yang tidak tepat atau mengelirukan.
  • Skalabiliti: Mengendalikan set data berskala besar dan trafik pengguna yang tinggi sambil mengekalkan prestasi boleh menjadi rumit.
  • Keselamatan: Memastikan privasi data dan pengendalian maklumat sensitif dengan selamat adalah penting, terutamanya dalam tetapan perusahaan.

Platform seperti SWIRL menangani isu ini dengan tidak memerlukan ETL (Extract, Transform, Load) atau pergerakan data, memastikan akses yang lebih pantas dan selamat kepada data.
Dengan SWIRL, pengambilan dan pemprosesan berlaku di dalam tembok api pengguna, yang membantu mengekalkan privasi data sambil memastikan respons berkualiti tinggi yang relevan. Penyepaduannya dengan model bahasa besar (LLM) sedia ada dan sumber data perusahaan menjadikannya penyelesaian yang cekap untuk mengatasi cabaran kependaman dan keselamatan RAG.

Terima kasih kerana membaca?

Terima kasih kerana membaca siaran saya dan lihatlah perpustakaan yang menarik ini. Kongsi siaran jika anda mahu. Saya menulis tentang AI, alatan sumber terbuka, Resume Match dan banyak lagi.

Ini adalah pegangan saya di mana anda boleh menghubungi saya:

Ikuti saya di DEV

Hubungi saya di LinkedIn

Ikuti saya di GitHub

Untuk kerjasama hantarkan saya e-mel di: srbh077@gmail.com

I Open Source Libraries To Build RAG, Agents & AI Search

Atas ialah kandungan terperinci Saya Perpustakaan Sumber Terbuka Untuk Membina Carian RAG, Ejen & AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bagaimana untuk menyelesaikan masalah kebenaran yang dihadapi semasa melihat versi Python di Terminal Linux? Bagaimana untuk menyelesaikan masalah kebenaran yang dihadapi semasa melihat versi Python di Terminal Linux? Apr 01, 2025 pm 05:09 PM

Penyelesaian kepada Isu Kebenaran Semasa Melihat Versi Python di Terminal Linux Apabila anda cuba melihat versi Python di Terminal Linux, masukkan Python ...

Bagaimana untuk mengelakkan dikesan oleh penyemak imbas apabila menggunakan fiddler di mana-mana untuk membaca lelaki-dalam-tengah? Bagaimana untuk mengelakkan dikesan oleh penyemak imbas apabila menggunakan fiddler di mana-mana untuk membaca lelaki-dalam-tengah? Apr 02, 2025 am 07:15 AM

Cara mengelakkan dikesan semasa menggunakan fiddlerevery di mana untuk bacaan lelaki-dalam-pertengahan apabila anda menggunakan fiddlerevery di mana ...

Bagaimana cara menyalin seluruh lajur satu data ke dalam data data lain dengan struktur yang berbeza di Python? Bagaimana cara menyalin seluruh lajur satu data ke dalam data data lain dengan struktur yang berbeza di Python? Apr 01, 2025 pm 11:15 PM

Apabila menggunakan Perpustakaan Pandas Python, bagaimana untuk menyalin seluruh lajur antara dua data data dengan struktur yang berbeza adalah masalah biasa. Katakan kita mempunyai dua DAT ...

Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam Kaedah Projek dan Masalah Dikemukakan Dalam masa 10 Jam? Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam Kaedah Projek dan Masalah Dikemukakan Dalam masa 10 Jam? Apr 02, 2025 am 07:18 AM

Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam masa 10 jam? Sekiranya anda hanya mempunyai 10 jam untuk mengajar pemula komputer beberapa pengetahuan pengaturcaraan, apa yang akan anda pilih untuk mengajar ...

Bagaimanakah uvicorn terus mendengar permintaan http tanpa serving_forever ()? Bagaimanakah uvicorn terus mendengar permintaan http tanpa serving_forever ()? Apr 01, 2025 pm 10:51 PM

Bagaimanakah Uvicorn terus mendengar permintaan HTTP? Uvicorn adalah pelayan web ringan berdasarkan ASGI. Salah satu fungsi terasnya ialah mendengar permintaan HTTP dan teruskan ...

Bagaimana untuk mendapatkan data berita yang melangkaui mekanisme anti-crawler Investing.com? Bagaimana untuk mendapatkan data berita yang melangkaui mekanisme anti-crawler Investing.com? Apr 02, 2025 am 07:03 AM

Memahami Strategi Anti-Crawling of Investing.com Ramai orang sering cuba merangkak data berita dari Investing.com (https://cn.investing.com/news/latest-news) ...

See all articles