


Kod sumber 25 ejen AI kini terbuka, diilhamkan oleh 'Bandar Maya' dan 'Westworld' Stanford
Khalayak yang biasa dengan "Westworld" tahu bahawa rancangan ini berlatarkan taman tema dewasa berteknologi tinggi yang besar di dunia masa hadapan plot cerita. Setiap hari, robot ini akan ditetapkan semula dan dikembalikan kepada keadaan asalnya
Selepas keluaran kertas kerja Stanford "Ejen Generatif: Simulakra Interaktif Tingkah Laku Manusia", senario ini tidak lagi terhad kepada filem dan siri TV, AI telah berjaya mengeluarkannya semula Gambaran keseluruhan adegan ini
Smallville's "virtual town"
- Alamat kertas: https://arxiv.org/pdf/2304.03442v1.pdf
- https://alamat projek github.com/joonspk-research/generative_agents
Para penyelidik berjaya mencipta sebuah bandar maya yang dipanggil Smallville, dengan 25 ejen AI di dalamnya. Mereka tinggal di bandar itu, mempunyai pekerjaan, bertukar gosip dan mengambil bahagian Bersosial, mencari kawan baharu , atau menganjurkan parti Hari Valentine. Setiap penduduk bandar mempunyai personaliti dan cerita latar belakang yang unik
Untuk meningkatkan realisme "penduduk bandar", pekan Smallville menyediakan berbilang pemandangan awam, seperti kafe, bar, taman, sekolah, asrama, Rumah dan kedai. Di Smallville, penduduk boleh bergerak bebas di antara tempat-tempat ini, berinteraksi dengan penduduk lain, malah bertegur sapa antara satu sama lain
Adegan di mana "penduduk bandar" boleh datang dan pergi sesuka hati
Bagaimanakah penduduk di perangai bandar sama dengan manusia? Sebagai contoh, apabila mereka melihat sarapan pagi terbakar, mereka akan mengambil inisiatif untuk pergi dan mematikan dapur apabila mereka mendapati seseorang di dalam bilik mandi, mereka akan menunggu di luar apabila mereka bertemu dengan seseorang yang ingin diajak bercakap, mereka akan berhenti; dan berbual...
Maaf Malangnya, penyelidikan ini tidak didedahkan kepada umum pada masa itu, dan maklumat lanjut hanya boleh diperoleh melalui kertas yang diterbitkan. Namun, kini setelah masa berlalu, para penyelidik telah menjadikan penyelidikan ini sumber terbuka
Berita ini turut disahkan oleh Joon Sung Park, seorang pelajar kedoktoran Stanford dan salah seorang pengarang kertas kerja
Dengan Sumber terbuka projek itu dijangka memberi impak yang luas kepada industri permainan dan memenuhi jangkaan netizen. Permainan komputer masa depan mungkin menampilkan bandar maya di mana setiap penduduk mempunyai kehidupan, kerja dan hobi yang bebas, membolehkan pemain berinteraksi dengan mereka secara realistik
"Saya percaya kajian ini menandakan permulaan AGI's Start. Walaupun kami masih banyak kerja yang perlu dilakukan, ini adalah jalan yang betul. , sesetengah orang bimbang. Kita semua tahu bahawa membina ejen AI memerlukan bergantung pada model besar, tetapi kita mesti mempertimbangkan masalah: LLM sedang "dijinakkan" secara beransur-ansur oleh manusia, jadi ia tidak dapat mencerminkan sepenuhnya emosi dan tingkah laku sebenar manusia, dan hanya boleh menunjukkan tingkah laku yang difikirkan oleh manusia. adalah baik, dan tingkah laku seperti kemarahan, jenayah, ketidaksamaan, cemburu, keganasan, dsb. akan menjadi lemah pada tahap yang besar. Oleh itu, adalah sukar bagi ejen AI untuk meniru sepenuhnya kehidupan sebenar manusia
Dalam apa jua keadaan, orang ramai masih ghairah tentang sumber terbuka Smallville
Sebagai tambahan kepada "bandar maya" Smallville sumber terbuka Stanford, kami juga ingin menyenaraikan beberapa ejen AI lain
Syarikat permulaan Fable menggunakan ejen AI untuk melengkapkan penulisan skrip, animasi, pengarahan, penyuntingan dan proses pengeluaran lain sepenuhnya oleh AI , berjaya merakam episod "South Park"
ejen NVIDIA AI Voyager disambungkan ke GPT-4 dan boleh memainkan "Minecraft" tanpa campur tangan manusia.
Ejen AI generalis Ghost in the Minecraft (GITM) yang dibangunkan bersama oleh SenseTime, Universiti Tsinghua dan institusi lain telah menunjukkan prestasi cemerlang dalam Minecraft yang mengatasi semua ejen sebelumnya dan mengurangkan Kos Latihan dengan ketara
adalah lebih banyak kajian, kita tidak boleh menyenaraikan semuanya. Dengan sumber terbuka Stanford Virtual Town, kami percaya bahawa lebih banyak syarikat dan institusi akan menyertai barisan🎜🎜
Atas ialah kandungan terperinci Kod sumber 25 ejen AI kini terbuka, diilhamkan oleh 'Bandar Maya' dan 'Westworld' Stanford. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Anotasi teks ialah kerja label atau teg yang sepadan dengan kandungan tertentu dalam teks. Tujuan utamanya adalah untuk memberikan maklumat tambahan kepada teks untuk analisis dan pemprosesan yang lebih mendalam, terutamanya dalam bidang kecerdasan buatan. Anotasi teks adalah penting untuk tugas pembelajaran mesin yang diawasi dalam aplikasi kecerdasan buatan. Ia digunakan untuk melatih model AI untuk membantu memahami maklumat teks bahasa semula jadi dengan lebih tepat dan meningkatkan prestasi tugasan seperti klasifikasi teks, analisis sentimen dan terjemahan bahasa. Melalui anotasi teks, kami boleh mengajar model AI untuk mengenali entiti dalam teks, memahami konteks dan membuat ramalan yang tepat apabila data baharu yang serupa muncul. Artikel ini terutamanya mengesyorkan beberapa alat anotasi teks sumber terbuka yang lebih baik. 1.LabelStudiohttps://github.com/Hu

Anotasi imej ialah proses mengaitkan label atau maklumat deskriptif dengan imej untuk memberi makna dan penjelasan yang lebih mendalam kepada kandungan imej. Proses ini penting untuk pembelajaran mesin, yang membantu melatih model penglihatan untuk mengenal pasti elemen individu dalam imej dengan lebih tepat. Dengan menambahkan anotasi pada imej, komputer boleh memahami semantik dan konteks di sebalik imej, dengan itu meningkatkan keupayaan untuk memahami dan menganalisis kandungan imej. Anotasi imej mempunyai pelbagai aplikasi, meliputi banyak bidang, seperti penglihatan komputer, pemprosesan bahasa semula jadi dan model penglihatan graf Ia mempunyai pelbagai aplikasi, seperti membantu kenderaan dalam mengenal pasti halangan di jalan raya, dan membantu dalam proses. pengesanan dan diagnosis penyakit melalui pengecaman imej perubatan. Artikel ini terutamanya mengesyorkan beberapa alat anotasi imej sumber terbuka dan percuma yang lebih baik. 1.Makesen

Teknologi pengesanan dan pengecaman muka adalah teknologi yang agak matang dan digunakan secara meluas. Pada masa ini, bahasa aplikasi Internet yang paling banyak digunakan ialah JS Melaksanakan pengesanan muka dan pengecaman pada bahagian hadapan Web mempunyai kelebihan dan kekurangan berbanding dengan pengecaman muka bahagian belakang. Kelebihan termasuk mengurangkan interaksi rangkaian dan pengecaman masa nyata, yang sangat memendekkan masa menunggu pengguna dan meningkatkan pengalaman pengguna termasuk: terhad oleh saiz model, ketepatannya juga terhad. Bagaimana untuk menggunakan js untuk melaksanakan pengesanan muka di web? Untuk melaksanakan pengecaman muka di Web, anda perlu biasa dengan bahasa dan teknologi pengaturcaraan yang berkaitan, seperti JavaScript, HTML, CSS, WebRTC, dll. Pada masa yang sama, anda juga perlu menguasai visi komputer yang berkaitan dan teknologi kecerdasan buatan. Perlu diingat bahawa kerana reka bentuk bahagian Web

SOTA baharu untuk keupayaan memahami dokumen multimodal! Pasukan Alibaba mPLUG mengeluarkan kerja sumber terbuka terkini mPLUG-DocOwl1.5, yang mencadangkan satu siri penyelesaian untuk menangani empat cabaran utama pengecaman teks imej resolusi tinggi, pemahaman struktur dokumen am, arahan mengikut dan pengenalan pengetahuan luaran. Tanpa berlengah lagi, mari kita lihat kesannya dahulu. Pengecaman satu klik dan penukaran carta dengan struktur kompleks ke dalam format Markdown: Carta gaya berbeza tersedia: Pengecaman dan kedudukan teks yang lebih terperinci juga boleh dikendalikan dengan mudah: Penjelasan terperinci tentang pemahaman dokumen juga boleh diberikan: Anda tahu, "Pemahaman Dokumen " pada masa ini Senario penting untuk pelaksanaan model bahasa yang besar. Terdapat banyak produk di pasaran untuk membantu pembacaan dokumen. Sesetengah daripada mereka menggunakan sistem OCR untuk pengecaman teks dan bekerjasama dengan LLM untuk pemprosesan teks.

FP8 dan ketepatan pengiraan titik terapung yang lebih rendah bukan lagi "paten" H100! Lao Huang mahu semua orang menggunakan INT8/INT4, dan pasukan Microsoft DeepSpeed memaksa diri mereka menjalankan FP6 pada A100 tanpa sokongan rasmi daripada Nvidia. Keputusan ujian menunjukkan bahawa kaedah baharu TC-FPx FP6 kuantisasi pada A100 adalah hampir atau kadangkala lebih pantas daripada INT4, dan mempunyai ketepatan yang lebih tinggi daripada yang terakhir. Selain itu, terdapat juga sokongan model besar hujung ke hujung, yang telah bersumberkan terbuka dan disepadukan ke dalam rangka kerja inferens pembelajaran mendalam seperti DeepSpeed. Keputusan ini juga mempunyai kesan serta-merta pada mempercepatkan model besar - di bawah rangka kerja ini, menggunakan satu kad untuk menjalankan Llama, daya pemprosesan adalah 2.65 kali lebih tinggi daripada dua kad. satu

Izinkan saya memperkenalkan kepada anda projek sumber terbuka AIGC terkini-AnimagineXL3.1. Projek ini adalah lelaran terkini model teks-ke-imej bertema anime, yang bertujuan untuk menyediakan pengguna pengalaman penjanaan imej anime yang lebih optimum dan berkuasa. Dalam AnimagineXL3.1, pasukan pembangunan menumpukan pada mengoptimumkan beberapa aspek utama untuk memastikan model mencapai tahap prestasi dan kefungsian yang baharu. Pertama, mereka mengembangkan data latihan untuk memasukkan bukan sahaja data watak permainan daripada versi sebelumnya, tetapi juga data daripada banyak siri anime terkenal lain ke dalam set latihan. Langkah ini memperkayakan pangkalan pengetahuan model, membolehkannya memahami pelbagai gaya dan watak anime dengan lebih lengkap. AnimagineXL3.1 memperkenalkan set teg khas dan estetika baharu

Alamat kertas: https://arxiv.org/abs/2307.09283 Alamat kod: https://github.com/THU-MIG/RepViTRepViT berprestasi baik dalam seni bina ViT mudah alih dan menunjukkan kelebihan yang ketara. Seterusnya, kami meneroka sumbangan kajian ini. Disebutkan dalam artikel bahawa ViT ringan biasanya berprestasi lebih baik daripada CNN ringan pada tugas visual, terutamanya disebabkan oleh modul perhatian diri berbilang kepala (MSHA) mereka yang membolehkan model mempelajari perwakilan global. Walau bagaimanapun, perbezaan seni bina antara ViT ringan dan CNN ringan belum dikaji sepenuhnya. Dalam kajian ini, penulis menyepadukan ViT ringan ke dalam yang berkesan

Model MoE sumber terbuka domestik berskala besar terbaharu telah menjadi popular selepas kemunculannya. Prestasi DeepSeek-V2 mencapai tahap GPT-4, tetapi ia adalah sumber terbuka, percuma untuk kegunaan komersial, dan harga API hanya satu peratus daripada GPT-4-Turbo. Oleh itu, sebaik sahaja dikeluarkan, ia segera mencetuskan banyak perbincangan. Berdasarkan petunjuk prestasi yang diterbitkan, keupayaan Cina komprehensif DeepSeekV2 mengatasi kebanyakan model sumber terbuka Pada masa yang sama, model sumber tertutup seperti GPT-4Turbo dan Wenkuai 4.0 juga berada dalam eselon pertama. Keupayaan bahasa Inggeris yang komprehensif juga berada dalam eselon pertama yang sama seperti LLaMA3-70B, dan mengatasi Mixtral8x22B, yang juga merupakan KPM. Ia juga menunjukkan prestasi yang baik dalam pengetahuan, matematik, penaakulan, pengaturcaraan, dll. Dan menyokong konteks 128K. Bayangkan ini
