Dalam sejarah panjang pembangunan teknologi manusia, automasi sentiasa menjadi daya penggerak utama, membantu manusia membebaskan diri mereka daripada persekitaran buruh yang kompleks, berbahaya dan membosankan. Daripada pengairan kincir air pada era awal pertanian kepada enjin wap dalam era perindustrian, manusia sentiasa mengejar teknologi automasi yang lebih maju untuk membebaskan diri mereka daripada kerja yang sukar
Dengan kemunculan era maklumat, perisian digunakan sebagai pemprosesan maklumat , Asas penyimpanan dan komunikasi telah menjadi bahagian yang tidak dapat dipisahkan dalam pengeluaran dan kehidupan manusia, yang telah membawa kepada pembentukan teknologi Automasi Proses Robot (RPA). Ia menyelaraskan berbilang perisian ke dalam aliran kerja yang kukuh (Aliran Kerja) melalui peraturan yang disusun secara manual, dan berinteraksi dengan perisian untuk mencapai pelaksanaan yang cekap dengan mensimulasikan interaksi manusia.
Dalam grafik ini kita membandingkan Robotic Process Automation (RPA) dengan Agent Process Automation (APA)
RPA (Robotic Process Automation) menggunakan robot perisian simulasi atau "BOT Melaksanakan tugasan yang berulang" untuk membebaskan sumber manusia dan meningkatkan kecekapan kerja. Skop aplikasi RPA sangat luas. Banyak perusahaan (termasuk bank, syarikat insurans, pembuatan, peruncitan dan industri lain) biasanya menggunakan robot RPA untuk mengautomasikan tugas rutin dan membosankan, seperti kemasukan data, pengekstrakan data dan pemprosesan data. Dengan mengautomasikan tugasan, RPA boleh mengurangkan kadar ralat dengan ketara dan dapat melaksanakan tugas 24*7, sekali gus meningkatkan kebolehpercayaan dan responsif perniagaan
Menurut penyelidikan pasaran, pasaran RPA berkembang pesat dan mencapai kejayaan besar. Gartner meramalkan bahawa hasil pasaran RPA global akan mencecah AS$3.3 bilion menjelang 2023, dengan kadar pertumbuhan 17.5%. Ini menunjukkan bahawa perusahaan mempunyai permintaan dan pengiktirafan yang sangat tinggi untuk RPA
Walau bagaimanapun, RPA hanya boleh menggantikan kerja manusia yang mudah dan mekanikal, dan beberapa proses yang kompleks masih bergantung kepada buruh manual:
Penyelidikan pasukan meneroka paradigma automasi baharu "Agentic Process Automation" (APA) dalam era ejen model besar. Berbanding dengan RPA tradisional, dalam paradigma APA, Ejen boleh melengkapkan pembinaan aliran kerja secara autonomi mengikut keperluan manusia Pada masa yang sama, ia boleh mengenal pasti bahagian keperluan manusia yang memerlukan pembuatan keputusan yang dinamik, menyusunnya secara automatik ke dalam aliran kerja. dan laksanakan aliran kerja apabila aliran kerja dilaksanakan Bahagian ini secara aktif mengambil alih pelaksanaan aliran kerja untuk menyelesaikan keputusan kompleks yang sepadan.
Untuk meneroka kemungkinan APA, kerja penyelidikan ini melaksanakan ejen automatik ProAgent, yang boleh menerima arahan manusia dan membina aliran kerja dengan menjana kod, dan memperkenalkan DataAgent dan ControlAgent ke dalam aliran kerja untuk Melaksanakan pemprosesan data yang kompleks dan kawalan logik . Penyelidikan ProAgent menunjukkan kebolehlaksanaan APA dalam era ejen model besar, dan juga mendedahkan kemungkinan baharu untuk teknologi automasi dalam era LLM. Pengenalan kaedah
Dalam RPA, aliran kerja ialah struktur graf yang terdiri daripada siri panggilan alat: nod mewakili panggilan alat atom (seperti Gmail, Twitter, Helaian Google), dan tepi mewakili Jujukan logik pelaksanaan ( bergabung, cawangan, gelung). Aliran kerja biasanya mengandungi semua pengetahuan terdahulu tentang tugas atau jenis tugas, termasuk laluan penyelesaian masalah dan logik pengendalian pengecualian. Oleh itu, menulis aliran kerja tetap selalunya sangat stabil, teliti dan cekap
Rajah 3 Contoh bahasa penerangan aliran kerja ejen
Dalam ProAgent, memandangkan LLM sendiri telah dilatih dalam data kod dan telah mempelajari keupayaan kod yang kukuh, kajian ini menggunakan aliran kerja ejen berasaskan kod Penerangan Aliran Kerja Agensi Bahasa Bahasa. Bahasa ini menggunakan JSON untuk mengatur dan mengurus data dalam aliran kerja, dan menggunakan sintaks Python untuk melaksanakan kawalan logik aliran kerja Lompat, gelung, dsb. dalam aliran kawalan diwakili secara langsung melalui sintaks Python aliran kerja adalah Panggilan dirangkumkan sebagai Fungsi Python. Jadi untuk ProAgent, tugas membina aliran kerja diubah menjadi tugas penjanaan kod. Apabila menerima arahan manusia, ProAgent menulis Bahasa Penerangan Aliran Kerja Agen yang sepadan, dengan itu merealisasikan pembinaan aliran kerja automatik. . bentuk tidak berkuasa apabila berhadapan dengan permintaan yang fleksibel, dan ejen perlu diperkenalkan pada masa ini. Oleh itu, kerja penyelidikan ini mentakrifkan lagi dua operasi Ejen:
1: Untuk keperluan pemprosesan data yang kompleks, bahasa semula jadi akan digunakan untuk menerangkan tugas pemprosesan apabila aliran kerja dibina, dan kemudian dimulakan semasa pelaksanaan A DataAgent yang. akan memproses dan menyelesaikan tugas pemprosesan data secara autonomi berdasarkan huraian bahasa semula jadi.
2: Untuk peraturan kawalan logik yang sukar dinyatakan oleh peraturan, bahasa semula jadi digunakan untuk menerangkan logik kawalan apabila aliran kerja dibina, dan kemudian ControlAgent dimulakan pada masa jalan, yang diterangkan. berdasarkan bahasa semula jadi Anda boleh memilih cawangan yang perlu dilaksanakan kemudian dalam aliran kerja.
ProAgent menggunakan mod ReACT untuk membina aliran kerja langkah demi langkah, yang mengandungi sejumlah empat langkah pembinaan aliran kerja:
Action_Define: Tentukan alat yang hendak ditambahkan pada aliran kerja.
Perlaksanaan Tindakan: Tukar parameter input/output alat kepada struktur JSON dan merangkum panggilan alat itu ke dalam fungsi Python.Pelaksanaan Aliran Kerja: Tentukan fungsi Aliran Kerja utama untuk mengatur kawalan logik dan pemprosesan data keseluruhan aliran kerja.
on -Constructing: Semasa proses pembinaan, ProAgent akan menguji aliran kerja selepas mengubah suai sekali untuk memastikan ketepatan aliran kerja.
Panggilan Fungsi: Semua operasi pembinaan aliran kerja dirangkumkan ke dalam Fungsi GPT-4, dengan itu meningkatkan kawalan ke atas proses pembinaan aliran kerja.
Chain-of-Thought: Apabila ProAgent menulis kod aliran kerja, adalah perlu untuk memberikan ulasan dan pelan penulisan untuk setiap fungsi untuk meningkatkan prestasi pembinaan aliran kerja ProAgent.
Untuk mengesahkan kebolehlaksanaan Automasi Proses Agen, kajian ini menggunakan OpenAI GPT-4 sebagai model asas dan platform RPA sumber terbuka n8n sebagai pembawa untuk melaksanakan ProAgent yang disebutkan di atas. Pada masa yang sama, kami merangka tugasan yang memerlukan fleksibiliti dan kecekapan: ini adalah senario perniagaan biasa, yang memerlukan pengekstrakan data keuntungan pelbagai bidang perniagaan daripada Helaian Google dan menentukan tindakan seterusnya berdasarkan sama ada perniagaan itu 2B atau 2C. Setelah barisan perniagaan ditentukan sebagai 2C, mesej dihantar ke saluran Slack. Untuk barisan perniagaan dalam 2B, e-mel dihantar kepada pengurus masing-masing, yang merangkumi penilaian baris perniagaan dan gambaran keseluruhan keuntungan ringkas.
Figure 6 Paparan Arahan Tugas
Kandungan yang perlu ditulis semula adalah: untuk tugas ini, pertama sekali, ia adalah tugas berulang. diterima pakai. Kedua, adalah sangat sukar untuk membezakan sama ada barisan perniagaan ialah 2C atau 2B, dan ia memerlukan pembuatan keputusan yang dinamik oleh Ejen untuk menentukan aliran kerja seterusnya. Akhir sekali, menulis e-mel penilaian barisan perniagaan memerlukan sejumlah kecerdasan, jadi campur tangan Ejen diperlukan
Dalam generasi ProAgent, untuk tugas ini, aliran kerja yang mengandungi empat operasi atom, Agen Data dan Agen Kawalan telah ditulis. Proses keseluruhan secara kasar ditunjukkan dalam rajah di bawah:
Rajah 7 Paparan proses pembinaan aliran kerja ProAgent
Dapat dilihat bahawa ProAgent melengkapkan proses pembinaan aliran kerja secara automatik dengan menulis kodnya sendiri, tanpa melibatkan kerja manual. campur tangan. Apabila perlu untuk menentukan sama ada barisan perniagaan ialah 2B atau 2C, ProAgent memperkenalkan ControlAgent untuk membuat pertimbangan. Apabila barisan perniagaan adalah 2B, ProAgent juga memperkenalkan DataAgent, yang tugasnya ditetapkan kepada "Tulis e-mel barisan perniagaan keuntungan, bersama-sama dengan cadangan anda", dengan itu menggunakan kecerdasan ejen untuk menulis berdasarkan situasi sebenar mel perniagaan yang berbeza.
Selepas aliran kerja ditulis dan diperkukuh, aliran kerja akan secara automatik bercabang kepada logik yang berbeza mengikut data berbeza untuk pemprosesan data yang cekap.
Rajah 8 Paparan proses pelaksanaan aliran kerja ProAgent
Apabila memproses data baris perniagaan 2C, ControlAgent boleh menentukan jenis baris perniagaan semasa berdasarkan penerangan baris perniagaan dan memilih untuk menggunakan alat Slack komunikasi. Apabila memproses data barisan perniagaan 2B, DataAgent boleh mengarang e-mel dan menghantarnya ke peti mel pengurus yang sepadan
Penyelidikan ini mencadangkan paradigma automasi baharu - Automasi Proses Agen, sesuai untuk Era Model berskala besar. Berbanding dengan teknologi Automasi Proses Robotik tradisional, Automasi Proses Agentik boleh mengautomasikan pembinaan aliran kerja dan merealisasikan automasi keputusan dinamik semasa pelaksanaan aliran kerja. Penyelidikan itu turut membangunkan lagi ProAgent dan secara eksperimen menunjukkan kebolehlaksanaan dan potensi ejen model besar dalam automasi. Saya percaya bahawa pada masa hadapan, teknologi agen model besar akan membantu manusia mencapai tahap automasi yang lebih tinggi dan membebaskan diri mereka daripada kerja berat
Pada masa ini, pasukan penyelidik telah menjalankan banyak kajian dalam arah ejen model besar. Termasuk:
Atas ialah kandungan terperinci ProAgent: Ejen pintar yang diketuai oleh OpenAI membebaskan tenaga kerja, dikeluarkan oleh Universiti Tsinghua dan universiti lain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!