Rumah > Peranti teknologi > AI > Menguasai AI Perniagaan: Membina Platform AI Gred Perusahaan dengan RAG dan CRAG

Menguasai AI Perniagaan: Membina Platform AI Gred Perusahaan dengan RAG dan CRAG

王林
Lepaskan: 2024-02-26 10:46:05
ke hadapan
1216 orang telah melayarinya

Semak imbas panduan kami untuk mengetahui cara memanfaatkan teknologi AI sepenuhnya untuk perniagaan anda. Ketahui tentang perkara seperti penyepaduan RAG dan CRAG, pembenaman vektor, LLM dan kejuruteraan segera, yang akan memberi manfaat kepada perniagaan yang ingin menggunakan kecerdasan buatan secara bertanggungjawab.

Membina Platform Sedia AI untuk Perusahaan

Perusahaan Apabila memperkenalkan kecerdasan buatan generatif , mereka akan menghadapi banyak risiko pengurusan strategik. Risiko-risiko ini selalunya saling berkait dan berkisar daripada potensi berat sebelah yang membawa kepada isu pematuhan kepada kekurangan pengetahuan domain. Isu utama termasuk kerosakan reputasi, pematuhan piawaian undang-undang dan kawal selia (terutamanya berkaitan dengan interaksi pelanggan), pelanggaran harta intelek, isu etika dan isu privasi (terutamanya apabila memproses data peribadi atau data yang boleh dikenal pasti).

Untuk menangani cabaran ini, strategi hibrid seperti retrieval-augmented generation (RAG) dicadangkan. Teknologi RAG boleh meningkatkan kualiti kandungan yang dijana kecerdasan buatan dan menjadikan rancangan kecerdasan buatan perusahaan lebih selamat dan lebih dipercayai. Strategi ini berkesan menangani isu-isu seperti kekurangan pengetahuan dan maklumat yang salah, di samping memastikan pematuhan kepada garis panduan undang-undang dan etika dan mencegah kerosakan reputasi dan ketidakpatuhan.

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

Ketahui tentang Retrieval Augmentation Generation (RAG)

Ketahui tentang Retrieval Augmentation Generation (RAG)

peningkatan prestasi menyepadukan maklumat daripada pangkalan pengetahuan perusahaan Ketepatan dan kebolehpercayaan dalam penciptaan kandungan AI. Fikirkan RAG sebagai tukang masak induk yang bergantung pada bakat semula jadi, latihan menyeluruh dan bakat kreatif, semuanya disokong oleh pemahaman menyeluruh tentang asas memasak. Apabila tiba masanya untuk menggunakan rempah yang luar biasa atau memenuhi permintaan untuk hidangan baru, cef merujuk kepada rujukan masakan yang boleh dipercayai untuk memastikan penggunaan bahan terbaik.

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

Sama seperti chef boleh memasak pelbagai masakan, sistem kecerdasan buatan seperti GPT dan LLaMA-2 juga boleh menjana kandungan mengenai pelbagai topik. Walau bagaimanapun, apabila tiba masanya untuk memberikan maklumat terperinci dan tepat, terutamanya apabila berurusan dengan masakan baru atau menyemak imbas sejumlah besar data korporat, mereka beralih kepada alat khas untuk memastikan ketepatan dan kedalaman maklumat.

Bagaimana jika fasa pengambilan RAG tidak mencukupi?

CRAG ialah campur tangan pembetulan yang direka untuk meningkatkan kestabilan tetapan RAG. CRAG menggunakan T5 untuk menilai kaitan dokumen yang diambil. Apabila dokumen sumber korporat dianggap tidak relevan, carian web boleh digunakan untuk mengisi jurang maklumat. Pertimbangan Senibina untuk Penyelesaian AI Generatif Gred Perusahaan .

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

data

Photographed

in: Langkah pertama adalah untuk menukar kandungan dokumen syarikat ke dalam format yang mudah dipersoalkan. Transformasi ini dilakukan menggunakan model benam, mengikut urutan operasi berikut Segmentasi data:

  1. Pelbagai dokumen daripada sumber pengetahuan perusahaan seperti Confluence, Jira dan PDF yang diekstrak adalah sistem. Langkah ini melibatkan pemecahan dokumen kepada bahagian yang boleh diurus, selalunya dipanggil "ketulan." Model benam:
  2. Kemudian hantar ketulan dokumen ini kepada model benam. Model pembenaman ialah rangkaian saraf yang menukarkan teks ke dalam bentuk berangka (vektor) yang mewakili semantik teks, menjadikannya mudah difahami oleh mesin.
  3. Blok indeks:
  4. Vektor yang dihasilkan oleh model benam kemudian diindeks. Pengindeksan ialah proses menyusun data dengan cara yang memudahkan perolehan semula yang cekap.
  5. Pangkalan Data Vektor:
  6. Simpan semua pembenaman vektor dalam pangkalan data vektor. Dan simpan teks yang diwakili oleh setiap benam dalam fail yang berbeza, pastikan anda menyertakan rujukan kepada benam yang sepadan.

Query and Smart Retrieval: Setelah pelayan inferens menerima soalan pengguna, ia menukarnya kepada vektor melalui proses pembenaman, yang menggunakan model yang sama untuk membenamkan dokumen dalam pangkalan pengetahuan. Pangkalan data vektor kemudiannya dicari untuk mengenal pasti vektor yang berkait rapat dengan niat pengguna dan disalurkan kepada model bahasa besar (LLM) untuk memperkayakan konteks.

5.Pertanyaan: Pertanyaan daripada lapisan aplikasi dan API. Pertanyaan ialah apa yang dimasukkan oleh pengguna atau aplikasi lain semasa mencari maklumat.

6.Pendapatan pertanyaan terbenam: Gunakan Vector.Embedding yang dijana untuk memulakan carian dalam indeks pangkalan data vektor. Pilih bilangan vektor yang anda ingin dapatkan daripada pangkalan data vektor;

7. Vektor (vektor persamaan): Proses ini mengenal pasti vektor serupa yang mewakili ketulan dokumen konteks yang berkaitan dengan pertanyaan

8.Dapatkan vektor berkaitan:
Dapatkan vektor berkaitan daripada pangkalan data vektor. Sebagai contoh, dalam konteks chef, ia mungkin sama dengan dua vektor yang berkaitan: resipi dan langkah penyediaan. Serpihan yang sepadan akan dikumpul dan disediakan dengan gesaan.

9. Dapatkan potongan yang berkaitan: Sistem mengambil bahagian dokumen yang sepadan dengan vektor yang dikenal pasti berkaitan dengan pertanyaan. Setelah kaitan maklumat telah dinilai, sistem menentukan langkah seterusnya. Jika maklumat itu benar-benar konsisten, ia akan disenaraikan mengikut kepentingan. Jika maklumat itu salah, sistem akan membuangnya dan mencari maklumat yang lebih baik dalam talian.

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

Jana Gesaan Kejuruteraan dan LLM Jana Gesaan Kejuruteraan adalah penting untuk membimbing model bahasa yang besar untuk memberikan jawapan yang betul . Ia melibatkan mencipta soalan yang jelas dan tepat yang mengambil kira sebarang jurang data. Proses ini berterusan dan memerlukan pelarasan tetap untuk respons yang lebih baik. Ia juga penting untuk memastikan soalan adalah beretika, bebas berat sebelah dan mengelakkan topik sensitif. 10. Kejuruteraan Prompt:

Bongkahan yang diambil kemudian digunakan dengan pertanyaan asal untuk mencipta gesaan. Pembayang ini direka bentuk untuk menyampaikan konteks pertanyaan dengan berkesan kepada model bahasa. 11. LLM (Model Bahasa Skala Besar):

Petua kejuruteraan dikendalikan oleh model bahasa yang besar. Model ini boleh menjana teks seperti manusia berdasarkan input yang mereka terima. 12. Jawapan:

Akhir sekali, model bahasa menggunakan konteks yang disediakan oleh pembayang dan potongan yang diambil untuk menjana jawapan kepada pertanyaan. Jawapan itu kemudiannya dihantar semula kepada pengguna melalui aplikasi dan lapisan API. . Dengan menangani kerumitan kejuruteraan tepat pada masanya, pengurusan data dan pendekatan penjanaan tambahan perolehan semula (RAG) yang inovatif, kami menggariskan cara untuk membenamkan teknologi AI ke dalam teras operasi perniagaan. Perbincangan akan datang akan mendalami lagi Rangka Kerja Kepintaran Buatan Generatif untuk Pembangunan Pintar, meneliti alatan, teknik dan strategi khusus untuk memaksimumkan penggunaan kecerdasan buatan bagi memastikan persekitaran pembangunan yang lebih bijak dan cekap. .

Atas ialah kandungan terperinci Menguasai AI Perniagaan: Membina Platform AI Gred Perusahaan dengan RAG dan CRAG. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan