Al Agent--Satu hala tuju pelaksanaan yang penting dalam era model besar-AI-php.cn

Jadual Kandungan

1. Seni bina keseluruhan Agen berasaskan LLM

1 maklumat Agen

Borang ingatan: Terutamanya berdasarkan 4 borang berikut.

2. Isu Utama & Sukar Ejen berasaskan LLM

(1) Definisi kebolehan main peranan ejen

Penukaran penentuan syarat ejen

(2) Memori jangka pendek

IV pembangunan perisian berbilang ejen berdasarkan model bahasa yang besar

Rumah

Peranti teknologi

Al Agent--Satu hala tuju pelaksanaan yang penting dalam era model besar

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 15, 2024 am 09:10 AM

AI model bahasa yang besar ai agent

1. Seni bina keseluruhan Agen berasaskan LLM

Al Agent--大模型时代重要落地方向

Komposisi model bahasa besar Ejen terbahagi terutamanya kepada 4 modul berikut:

1 maklumat Agen

Berikut memperkenalkan kandungan utama dan strategi penjanaan modul potret.

Kandungan potret terutamanya berdasarkan 3 jenis maklumat: maklumat demografi, maklumat personaliti dan maklumat sosial.

Strategi penjanaan: 3 strategi digunakan terutamanya untuk menjana kandungan potret:

Kaedah reka bentuk manual: Tulis kandungan potret pengguna ke dalam gesaan model besar dengan cara yang ditetapkan; daripada Ejen Agak sedikit situasi; Ejen;
Kaedah penjajaran data: Ia adalah perlu untuk menggunakan maklumat latar belakang aksara dalam set data yang telah ditetapkan sebagai gesaan model bahasa besar, dan kemudian membuat ramalan yang sepadan. . dipertimbangkan, bukan ingatan jangka panjang.
Memori Hibrid: Ingatan jangka panjang dan ingatan jangka pendek digabungkan.

Borang ingatan: Terutamanya berdasarkan 4 borang berikut.

Bahasa

Pangkalan data
Perwakilan vektor

Kandungan ingatan: 3 operasi biasa berikut ialah:
Bacaan ingatan
Penulisan ingatan
Renungan ingatan

model perancangan besar 3. dalam proses inferens Tiada maklum balas daripada persekitaran luaran diperlukan. Perancangan jenis ini dibahagikan lagi kepada tiga jenis: penaakulan berasaskan saluran tunggal, yang menggunakan model bahasa besar sekali sahaja untuk mengeluarkan sepenuhnya langkah-langkah penaakulan berasaskan pelbagai saluran, menggunakan idea crowdsourcing; membenarkan model bahasa besar menjana berbilang Sebabkan laluan dan tentukan laluan terbaik;
Merancang dengan maklum balas: Kaedah perancangan ini memerlukan maklum balas daripada persekitaran luaran, manakala model bahasa besar memerlukan maklum balas daripada persekitaran untuk langkah seterusnya dan perancangan seterusnya. Pembekal jenis maklum balas perancangan ini datang daripada tiga sumber: maklum balas alam sekitar, maklum balas manusia dan maklum balas model.
4. Modul Tindakan

Matlamat tindakan: Beberapa matlamat Ejen adalah untuk menyelesaikan tugas, ada yang berkomunikasi dan ada yang meneroka.

Penjanaan tindakan: Sesetengah Ejen bergantung pada ingatan ingatan untuk menjana tindakan, dan sesetengahnya melakukan tindakan tertentu mengikut pelan asal.
Ruang tindakan: Sesetengah ruang tindakan ialah koleksi alatan dan sesetengahnya berdasarkan pengetahuan model bahasa besar itu sendiri, dengan mengambil kira keseluruhan ruang tindakan dari perspektif kesedaran diri.

Impak tindakan: termasuk kesan ke atas alam sekitar, kesan ke atas keadaan dalaman dan kesan ke atas tindakan baharu pada masa hadapan.

Di atas adalah rangka kerja keseluruhan Ejen Untuk maklumat lanjut, sila rujuk kertas berikut:
Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Chen Zhang, Zhiyuan. , Jiakai Tang, Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, Ji-Rong Wen: Tinjauan tentang Ejen Autonomi berasaskan Model Bahasa Besar abs/2308.11432 (2023)
.
2. Isu Utama & Sukar Ejen berasaskan LLM

Isu utama dan sukar model bahasa besar semasa Ejen terutamanya termasuk:

1

Ejen Fungsi yang paling penting ialah untuk menyelesaikan tugasan tertentu atau menyelesaikan pelbagai simulasi dengan memainkan peranan tertentu, jadi keupayaan Ejen memainkan peranan adalah penting.

(1) Definisi kebolehan main peranan ejen

Keupayaan main peranan ejen dibahagikan kepada dua dimensi:
- Mekanisme watak dan tingkah laku Ejen
- dalam persekitaran
(2) Penilaian kebolehan main peranan ejen
Selepas menentukan kebolehan main peranan, langkah seterusnya ialah menilai keupayaan main peranan Ejen daripada dua aspek berikut:
kebolehan bermain peranan perlu dipertingkatkan lagi. Terdapat dua jenis: Kaedah:

Meningkatkan keupayaan main peranan melalui segera: Intipati kaedah ini adalah untuk merangsang keupayaan model bahasa besar asal dengan mereka bentuk segera;
- (1) Reka bentuk mekanisme memori ejen
Terdapat dua mekanisme ingatan biasa:

Mekanisme pengambilan memori

Pengambilan ingatan berdasarkan vektor
Mekanisme ingatan berdasarkan ringkasan LLM
- (2) Penilaian keupayaan ingatan ejen
- Untuk menilai keupayaan ingatan Ejen, adalah perlu untuk menentukan dua perkara berikut:
- Senario penilaian
- (3) Evolusi mekanisme memori ejen

Atas ialah kandungan terperinci Al Agent--Satu hala tuju pelaksanaan yang penting dalam era model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Penjimatan di R.E.P.O. Dijelaskan (dan simpan fail)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Cara Mencari Orang Panda

3 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7563

Tutorial CakePHP

1384

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Bytedance Cutting melancarkan keahlian super SVIP: 499 yuan untuk langganan tahunan berterusan, menyediakan pelbagai fungsi AI Jun 28, 2024 am 03:51 AM

Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Panduan langkah demi langkah untuk menggunakan Groq Llama 3 70B secara tempatan Jun 10, 2024 am 09:16 AM

Penterjemah |. Tinjauan Bugatti |. Chonglou Artikel ini menerangkan cara menggunakan enjin inferens GroqLPU untuk menjana respons sangat pantas dalam JanAI dan VSCode. Semua orang sedang berusaha membina model bahasa besar (LLM) yang lebih baik, seperti Groq yang memfokuskan pada bahagian infrastruktur AI. Sambutan pantas daripada model besar ini adalah kunci untuk memastikan model besar ini bertindak balas dengan lebih cepat. Tutorial ini akan memperkenalkan enjin parsing GroqLPU dan cara mengaksesnya secara setempat pada komputer riba anda menggunakan API dan JanAI. Artikel ini juga akan menyepadukannya ke dalam VSCode untuk membantu kami menjana kod, kod refactor, memasukkan dokumentasi dan menjana unit ujian. Artikel ini akan mencipta pembantu pengaturcaraan kecerdasan buatan kami sendiri secara percuma. Pengenalan kepada enjin inferens GroqLPU Groq

Pembantu pengekodan AI yang ditambah konteks menggunakan Rag dan Sem-Rag Jun 10, 2024 am 11:08 AM

Tingkatkan produktiviti, kecekapan dan ketepatan pembangun dengan menggabungkan penjanaan dipertingkatkan semula dan memori semantik ke dalam pembantu pengekodan AI. Diterjemah daripada EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, pengarang JanakiramMSV. Walaupun pembantu pengaturcaraan AI asas secara semulajadi membantu, mereka sering gagal memberikan cadangan kod yang paling relevan dan betul kerana mereka bergantung pada pemahaman umum bahasa perisian dan corak penulisan perisian yang paling biasa. Kod yang dijana oleh pembantu pengekodan ini sesuai untuk menyelesaikan masalah yang mereka bertanggungjawab untuk menyelesaikannya, tetapi selalunya tidak mematuhi piawaian pengekodan, konvensyen dan gaya pasukan individu. Ini selalunya menghasilkan cadangan yang perlu diubah suai atau diperhalusi agar kod itu diterima ke dalam aplikasi

Bolehkah penalaan halus benar-benar membolehkan LLM mempelajari perkara baharu: memperkenalkan pengetahuan baharu boleh menjadikan model menghasilkan lebih banyak halusinasi Jun 11, 2024 pm 03:57 PM

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Tujuh Soalan Temuduga Teknikal GenAI & LLM yang Cool Jun 07, 2024 am 10:06 AM

Untuk mengetahui lebih lanjut tentang AIGC, sila layari: 51CTOAI.x Komuniti https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou berbeza daripada bank soalan tradisional yang boleh dilihat di mana-mana sahaja di Internet memerlukan pemikiran di luar kotak. Model Bahasa Besar (LLM) semakin penting dalam bidang sains data, kecerdasan buatan generatif (GenAI) dan kecerdasan buatan. Algoritma kompleks ini meningkatkan kemahiran manusia dan memacu kecekapan dan inovasi dalam banyak industri, menjadi kunci kepada syarikat untuk kekal berdaya saing. LLM mempunyai pelbagai aplikasi Ia boleh digunakan dalam bidang seperti pemprosesan bahasa semula jadi, penjanaan teks, pengecaman pertuturan dan sistem pengesyoran. Dengan belajar daripada sejumlah besar data, LLM dapat menjana teks

Sebarkan model bahasa besar secara setempat dalam OpenHarmony Jun 07, 2024 am 10:02 AM

Artikel ini akan membuka sumber hasil "Pengedaran Tempatan Model Bahasa Besar dalam OpenHarmony" yang ditunjukkan pada Persidangan Teknologi OpenHarmony ke-2 alamat sumber terbuka: https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdparty/. InferLLM/docs/ hap_integrate.md. Idea dan langkah pelaksanaan adalah untuk memindahkan rangka kerja inferens model LLM ringan InferLLM kepada sistem standard OpenHarmony dan menyusun produk binari yang boleh dijalankan pada OpenHarmony. InferLLM ialah L yang mudah dan cekap

Lima sekolah pembelajaran mesin yang anda tidak tahu Jun 05, 2024 pm 08:51 PM

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

Untuk menyediakan tanda aras dan sistem penilaian menjawab soalan saintifik dan kompleks baharu untuk model besar, UNSW, Argonne, University of Chicago dan institusi lain bersama-sama melancarkan rangka kerja SciQAG Jul 25, 2024 am 06:42 AM

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

See all articles

Al Agent--Satu hala tuju pelaksanaan yang penting dalam era model besar

1. Seni bina keseluruhan Agen berasaskan LLM

1 maklumat Agen

Borang ingatan: Terutamanya berdasarkan 4 borang berikut.

Matlamat tindakan: Beberapa matlamat Ejen adalah untuk menyelesaikan tugas, ada yang berkomunikasi dan ada yang meneroka.

Impak tindakan: termasuk kesan ke atas alam sekitar, kesan ke atas keadaan dalaman dan kesan ke atas tindakan baharu pada masa hadapan.

2. Isu Utama & Sukar Ejen berasaskan LLM

1

(1) Definisi kebolehan main peranan ejen

Terdapat dua mekanisme ingatan biasa:

(2) Integrasi penaakulan Ejen dan maklum balas luaran🜎

mekanisme integrasi maklum balas luaran dalam proses penaakulan: Biarkan Ejen dan persekitaran membentuk keseluruhan yang interaktif; Sebaliknya, Ejen perlu boleh bertanya dan mencari penyelesaian kepada persekitaran luaran. . reka bentuk mekanisme kerjasama

Penukaran penentuan syarat ejen

1 Modul potret

menentukan atribut yang berbeza untuk Ejen yang berbeza, seperti ID, nama, pekerjaan, umur, minat, ciri, dll.

(2) Memori jangka pendek

Tingkah laku ejen dalam sistem pengesyoran, dan meninggalkan halaman cadangan, dan sebagainya. . ;

Tingkah laku perbualan antara Ejen;

IV pembangunan perisian berbilang ejen berdasarkan model bahasa yang besar

Alat AI Hot

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

Artikel Panas

Alat panas

Notepad++7.3.1

SublimeText3 versi Cina

Hantar Studio 13.0.1

Dreamweaver CS6

SublimeText3 versi Mac

Topik panas