1. Seni bina keseluruhan Agen berasaskan LLM
Komposisi model bahasa besar Ejen terbahagi terutamanya kepada 4 modul berikut:
1 maklumat Agen
Berikut memperkenalkan kandungan utama dan strategi penjanaan modul potret.
Kandungan potret terutamanya berdasarkan 3 jenis maklumat: maklumat demografi, maklumat personaliti dan maklumat sosial.
Strategi penjanaan: 3 strategi digunakan terutamanya untuk menjana kandungan potret:
- Kaedah reka bentuk manual: Tulis kandungan potret pengguna ke dalam gesaan model besar dengan cara yang ditetapkan; daripada Ejen Agak sedikit situasi; Ejen;
- Kaedah penjajaran data: Ia adalah perlu untuk menggunakan maklumat latar belakang aksara dalam set data yang telah ditetapkan sebagai gesaan model bahasa besar, dan kemudian membuat ramalan yang sepadan. . dipertimbangkan, bukan ingatan jangka panjang.
- Memori Hibrid: Ingatan jangka panjang dan ingatan jangka pendek digabungkan.
Borang ingatan: Terutamanya berdasarkan 4 borang berikut.
Bahasa
-
Pangkalan data
-
Perwakilan vektor
- Kandungan ingatan: 3 operasi biasa berikut ialah:
- Bacaan ingatan
- Penulisan ingatan
- Renungan ingatan
- model perancangan besar 3. dalam proses inferens Tiada maklum balas daripada persekitaran luaran diperlukan. Perancangan jenis ini dibahagikan lagi kepada tiga jenis: penaakulan berasaskan saluran tunggal, yang menggunakan model bahasa besar sekali sahaja untuk mengeluarkan sepenuhnya langkah-langkah penaakulan berasaskan pelbagai saluran, menggunakan idea crowdsourcing; membenarkan model bahasa besar menjana berbilang Sebabkan laluan dan tentukan laluan terbaik;
- Merancang dengan maklum balas: Kaedah perancangan ini memerlukan maklum balas daripada persekitaran luaran, manakala model bahasa besar memerlukan maklum balas daripada persekitaran untuk langkah seterusnya dan perancangan seterusnya. Pembekal jenis maklum balas perancangan ini datang daripada tiga sumber: maklum balas alam sekitar, maklum balas manusia dan maklum balas model.
- 4. Modul Tindakan
Matlamat tindakan: Beberapa matlamat Ejen adalah untuk menyelesaikan tugas, ada yang berkomunikasi dan ada yang meneroka.
- Penjanaan tindakan: Sesetengah Ejen bergantung pada ingatan ingatan untuk menjana tindakan, dan sesetengahnya melakukan tindakan tertentu mengikut pelan asal.
- Ruang tindakan: Sesetengah ruang tindakan ialah koleksi alatan dan sesetengahnya berdasarkan pengetahuan model bahasa besar itu sendiri, dengan mengambil kira keseluruhan ruang tindakan dari perspektif kesedaran diri.
Impak tindakan: termasuk kesan ke atas alam sekitar, kesan ke atas keadaan dalaman dan kesan ke atas tindakan baharu pada masa hadapan.
- Di atas adalah rangka kerja keseluruhan Ejen Untuk maklumat lanjut, sila rujuk kertas berikut:
- Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Chen Zhang, Zhiyuan. , Jiakai Tang, Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, Ji-Rong Wen: Tinjauan tentang Ejen Autonomi berasaskan Model Bahasa Besar abs/2308.11432 (2023)
- .
2. Isu Utama & Sukar Ejen berasaskan LLM
Isu utama dan sukar model bahasa besar semasa Ejen terutamanya termasuk:
1
Ejen Fungsi yang paling penting ialah untuk menyelesaikan tugasan tertentu atau menyelesaikan pelbagai simulasi dengan memainkan peranan tertentu, jadi keupayaan Ejen memainkan peranan adalah penting.
(1) Definisi kebolehan main peranan ejen
Keupayaan main peranan ejen dibahagikan kepada dua dimensi:
- Mekanisme watak dan tingkah laku Ejen
- dalam persekitaran
(2) Penilaian kebolehan main peranan ejen
Selepas menentukan kebolehan main peranan, langkah seterusnya ialah menilai keupayaan main peranan Ejen daripada dua aspek berikut:
Petunjuk penilaian main peranan Senario penilaian main peranan (3) Asas ejen, penilaian keupayaan🜎
kebolehan bermain peranan perlu dipertingkatkan lagi. Terdapat dua jenis: Kaedah:
Meningkatkan keupayaan main peranan melalui segera: Intipati kaedah ini adalah untuk merangsang keupayaan model bahasa besar asal dengan mereka bentuk segera;
Tingkatkan keupayaan main peranan melalui penalaan halus: Kaedah ini biasanya berdasarkan Menggunakan data luaran, perhalusi model bahasa besar sekali lagi untuk meningkatkan keupayaan main peranan. 2. watak peranan penting daripada. Analisis mekanisme ingatan Ejen daripada 3 dimensi: - (1) Reka bentuk mekanisme memori ejen
Terdapat dua mekanisme ingatan biasa:
Mekanisme pengambilan memori
Pengambilan ingatan berdasarkan vektor
Mekanisme ingatan berdasarkan ringkasan LLM
-
(2) Penilaian keupayaan ingatan ejen
- Untuk menilai keupayaan ingatan Ejen, adalah perlu untuk menentukan dua perkara berikut:
Penunjuk penilaian
- Senario penilaian
- (3) Evolusi mekanisme memori ejen
Akhirnya, evolusi mekanisme ingatan Ejen perlu dianalisis, termasuk:Evolusi mekanisme ingatan
- Definisi dan pembongkaran sub-tugas
- Tertib pelaksanaan tugas yang optimum
(2) Integrasi penaakulan Ejen dan maklum balas luaran🜎
mekanisme integrasi maklum balas luaran dalam proses penaakulan: Biarkan Ejen dan persekitaran membentuk keseluruhan yang interaktif; Sebaliknya, Ejen perlu boleh bertanya dan mencari penyelesaian kepada persekitaran luaran. . reka bentuk mekanisme kerjasama
- (2) Mekanisme perbahasan Pelbagai Ejen
- Reka bentuk mekanisme perbahasan ejen
Penukaran penentuan syarat ejen
-
3 berdasarkan model bahasa besar Ejen Simulasi Tingkah Laku
Berikut adalah beberapa kes sebenar Ejen. Yang pertama ialah ejen simulasi tingkah laku pengguna berdasarkan model bahasa yang besar. Ejen ini juga merupakan kerja awal dalam menggabungkan ejen model bahasa besar dengan analisis tingkah laku pengguna. Dalam kerja ini, setiap Ejen dibahagikan kepada tiga modul:
1 Modul potret
menentukan atribut yang berbeza untuk Ejen yang berbeza, seperti ID, nama, pekerjaan, umur, minat, ciri, dll.
- 2. Modul memori
Modul memori merangkumi tiga sub-modul - (1) Memori perasaan
(2) Memori jangka pendek
diperhatikan secara objektif pemerhatian mentah Selepas pemprosesan, pemerhatian dengan kandungan maklumat yang lebih tinggi dijana dan disimpan dalam ingatan jangka pendek
-
Masa penyimpanan kandungan ingatan jangka pendek adalah agak singkat
-
(3) Jangka panjang memori
Selepas pencetus dan pengaktifan berulang, kandungan ingatan jangka pendek akan dipindahkan secara automatik ke ingatan jangka panjang Masa penyimpanan kandungan ingatan jangka panjang adalah agak panjang penghalusan.
3. Modul Tindakan
Setiap Ejen boleh melakukan tiga tindakan:
Tingkah laku ejen dalam sistem pengesyoran, dan meninggalkan halaman cadangan, dan sebagainya. . ;
Tingkah laku perbualan antara Ejen;
Semasa keseluruhan proses simulasi, Ejen boleh bebas memilih tiga tindakan dalam setiap pusingan tindakan tanpa gangguan luar; kita dapat melihat bahawa Ejen yang berbeza akan bercakap antara satu sama lain dan juga akan Pelbagai tingkah laku dijana secara autonomi dalam media sosial atau sistem pengesyoran; selepas beberapa pusingan simulasi, beberapa fenomena sosial yang menarik boleh diperhatikan, serta peraturan tingkah laku pengguna di Internet.
Untuk maklumat lanjut, sila rujuk kertas berikut:
Lei Wang, Jingsen Zhang, Hao Yang, Zhiyuan Chen, Jiakai Tang, Zeyu Zhang, Xu Chen, Yankai Lin, Ruihua Song, Wayne Xin Zhao, Jun Xu, Zhicheng Dou, Jun Wang, Ji-Rong Wen:When Large Language Ejen berasaskan Model Bertemu Analisis Tingkah Laku Pengguna: Paradigma Simulasi Pengguna Novel
IV pembangunan perisian berbilang ejen berdasarkan model bahasa yang besar
Contoh penggunaan Agent seterusnya
. pelbagai Ejen melaksanakan pembangunan perisian. Kerja ini juga merupakan kerja awal kerjasama pelbagai Ejen, dan tujuan utamanya adalah untuk menggunakan Ejen yang berbeza untuk membangunkan perisian yang lengkap. Oleh itu, ia boleh dianggap sebagai sebuah syarikat perisian, dan Ejen yang berbeza akan memainkan peranan yang berbeza: sesetengah Ejen bertanggungjawab untuk reka bentuk, termasuk peranan seperti Ketua Pegawai Eksekutif, CTO, MSM, dll., beberapa Ejen bertanggungjawab untuk pengekodan, dan beberapa Ejen adalah terutamanya bertanggungjawab untuk ujian di samping itu, terdapat Beberapa ejen bertanggungjawab untuk menulis dokumen. Dengan cara ini, Ejen yang berbeza bertanggungjawab untuk tugas yang berbeza akhirnya, mekanisme kerjasama antara Ejen diselaraskan dan dikemas kini melalui komunikasi, dan proses pembangunan perisian yang lengkap akhirnya selesai.
5. Arah masa depan Agen berasaskan LLM
Ejen model bahasa besar pada masa ini boleh dibahagikan kepada dua - seperti MetaGPT, ChatDev , Ghost, DESP, dsb.
Ejen jenis ini akhirnya harus menjadi "superman" yang sejajar dengan nilai kemanusiaan yang betul, dengan dua "qualifier":
Sejajar dengan nilai kemanusiaan yang betul ;
Di luar kemampuan manusia biasa.
- Simulasikan dunia sebenar, seperti Ejen Generatif, Simulasi Sosial, RecAgent, dll.
Keupayaan yang diperlukan oleh Ejen jenis ini adalah bertentangan sepenuhnya dengan jenis pertama. .
Di samping itu, model bahasa besar semasa Ejen mempunyai dua titik kesakitan berikut:
Masalah ilusi
Oleh kerana Ejen perlu terus berinteraksi dengan persekitaran, ilusi setiap langkah akan menjadi ilusi , iaitu, ia akan berlaku Kesan kumulatif menjadikan masalah lebih serius oleh itu, ilusi model besar memerlukan perhatian lanjut di sini. Penyelesaiannya termasuk:
Mereka bentuk rangka kerja kerjasama manusia-mesin yang cekap;
-
Reka bentuk mekanisme campur tangan manusia yang cekap. Isu kecekapan
Semasa proses simulasi, kecekapan ialah isu yang sangat penting;
-
Di atas adalah kandungan yang dikongsikan kali ini, terima kasih semua.
Atas ialah kandungan terperinci Al Agent--Satu hala tuju pelaksanaan yang penting dalam era model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!