


Sistem pengendalian ejen AI model besar sumber terbuka: seperti Windos, mengawal ejen AI
Artikel ini dicetak semula dengan kebenaran AIGC Open Community Sila hubungi sumber untuk mencetak semula.
Jika anda ingin mengetahui lebih lanjut tentang AIGC, sila lawati: 51CTO AI Ia mempunyai keupayaan automasi yang berkuasa dan mencipta trek ejen AI baharu. Walau bagaimanapun, masih terdapat banyak masalah yang perlu diselesaikan dalam penjadualan subtugas, peruntukan sumber dan kerjasama antara AI.
Jadi penyelidik di Universiti Rutgers membangunkan AIOS, sistem pengendalian ejen AI dengan model besar pada terasnya. Ia boleh menyelesaikan masalah kadar panggilan sumber yang rendah dengan berkesan apabila bilangan ejen AI meningkat. Ia juga boleh menggalakkan penukaran konteks antara ejen, melaksanakan ejen serentak dan mengekalkan kawalan akses ejen.
Alamat sumber terbuka: https://github.com/agiresearch/AIOS
Alamat kertas: https://arxiv.org/abs/2403.16971
apa yang kami gunakan Sistem pengendalian PC adalah serupa dan terbahagi terutamanya kepada tiga blok utama: lapisan aplikasi, lapisan kernel dan lapisan perkakasan
. Satu-satunya perbezaan ialah AIOS membina pengurus kernel dalam lapisan kernel yang secara khusus menguruskan tugas yang berkaitan dengan model besar.
Lapisan aplikasi ,
terutamanya terdiri daripada aplikasi ejen (contohnya, ejen pelancongan, ejen matematik, ejen kod, dll.); dan model besar, OS Sistem ini digunakan terutamanya untuk pengurusan fail, dan model besar digunakan untuk penjadualan dan pengurusan ejen AI
Lapisan perkakasan terdiri daripada peranti perkakasan seperti CPU, GPU, memori dan peranti, tetapi teras model besar tidak boleh berinteraksi secara langsung dengan perkakasan Sebaliknya, sumber perkakasan diurus secara tidak langsung melalui panggilan yang disediakan oleh lapisan kernel untuk memastikan integriti dan kecekapan sistem.
AI Ejen Penjadual
Penjadual Ejen AI bertanggungjawab terutamanya untuk menjadualkan secara munasabah dan mengoptimumkan permintaan ejen model besar untuk menggunakan sepenuhnya sumber pengkomputeran model besar. Apabila berbilang ejen memulakan permintaan kepada model besar pada masa yang sama, penjadual perlu mengisih permintaan mengikut algoritma penjadualan tertentu untuk mengelakkan ejen tunggal menduduki model besar untuk masa yang lama dan menyebabkan ejen lain menunggu untuk masa yang lama .
Selain itu, reka bentuk AIOS juga menyokong strategi penjadualan yang lebih kompleks, contohnya, mengambil kira kebergantungan antara permintaan proksi untuk mencapai peruntukan sumber yang lebih optimum. Apabila tiada arahan penjadualan, ejen perlu melaksanakan tugas satu persatu mengikut urutan, dan ejen seterusnya perlu menunggu lama
Selepas menggunakan algoritma penjadualan, permintaan setiap ejen boleh disilang dan dilaksanakan secara selari, dengan ketara mengurangkan masa menunggu keseluruhan dan Kelewatan respons.
Pengurus Konteks
Memandangkan proses penjanaan model besar secara amnya menggunakan carian heuristik seperti Beam Search, pepohon carian akan dibina secara beransur-ansur dan laluan yang berbeza akan dinilai untuk akhirnya memberikan hasil.
Walau bagaimanapun, jika model besar diganggu oleh penjadual semasa proses penjanaan, untuk mengelakkan kehilangan semua keadaan perantaraan dan membazirkan pengiraan sebelumnya, pengurus konteks akan mengambil gambar keadaan pokok Carian Rasuk semasa (termasuk kebarangkalian setiap laluan, dsb.) .
Apabila model besar memperoleh semula sumber pelaksanaan, pengurus konteks boleh memulihkan keadaan Carian Rasuk sebelumnya dengan tepat dari titik gangguan dan terus menjana bahagian yang tinggal, memastikan integriti dan ketepatan hasil akhir.
Selain itu, kebanyakan model besar mempunyai had panjang konteks dan konteks input dalam senario sebenar selalunya melebihi had ini. Untuk menyelesaikan masalah ini, pengurus konteks menyepadukan fungsi seperti ringkasan teks, yang boleh memampatkan atau menyekat konteks panjang, membolehkan model besar memahami dan memproses maklumat konteks panjang dengan cekap.
Pengurus Memori
🎜Pengurus memori bertanggungjawab terutamanya untuk mengurus sumber ingatan jangka pendek dan menyediakan storan sementara yang cekap untuk setiap log interaksi dan data perantaraan ejen AI. 🎜🎜Apabila ejen AI sedang menunggu untuk pelaksanaan atau berjalan, data yang diperlukannya akan disimpan dalam blok memori yang diperuntukkan oleh pengurus memori. Sebaik sahaja tugas ejen tamat, blok memori yang sepadan juga akan dikitar semula oleh sistem untuk memastikan penggunaan sumber memori yang cekap.
AIOS akan memperuntukkan memori bebas untuk setiap ejen AI dan mencapai pengasingan memori antara ejen yang berbeza melalui pengurus akses. Pada masa hadapan, AIOS akan memperkenalkan mekanisme perkongsian memori yang lebih kompleks dan strategi caching hierarki untuk terus mengoptimumkan prestasi keseluruhan ejen AI.
Jika anda ingin mengetahui lebih lanjut tentang AIGC, sila layari: 51CTO AI.x Community
https://www.51cto.com/aigc/
Atas ialah kandungan terperinci Sistem pengendalian ejen AI model besar sumber terbuka: seperti Windos, mengawal ejen AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Teknologi pengesanan dan pengecaman muka adalah teknologi yang agak matang dan digunakan secara meluas. Pada masa ini, bahasa aplikasi Internet yang paling banyak digunakan ialah JS Melaksanakan pengesanan muka dan pengecaman pada bahagian hadapan Web mempunyai kelebihan dan kekurangan berbanding dengan pengecaman muka bahagian belakang. Kelebihan termasuk mengurangkan interaksi rangkaian dan pengecaman masa nyata, yang sangat memendekkan masa menunggu pengguna dan meningkatkan pengalaman pengguna termasuk: terhad oleh saiz model, ketepatannya juga terhad. Bagaimana untuk menggunakan js untuk melaksanakan pengesanan muka di web? Untuk melaksanakan pengecaman muka di Web, anda perlu biasa dengan bahasa dan teknologi pengaturcaraan yang berkaitan, seperti JavaScript, HTML, CSS, WebRTC, dll. Pada masa yang sama, anda juga perlu menguasai visi komputer yang berkaitan dan teknologi kecerdasan buatan. Perlu diingat bahawa kerana reka bentuk bahagian Web

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh
