Gabungan terkuat: HuggingFace+ChatGPT -
HuggingGPT, sudah sampai!
Hanya berikan tugas AI, seperti "Haiwan apakah yang terdapat dalam gambar di bawah, dan berapa bilangan setiap jenis yang ada?"
Ia boleh membantu anda menganalisis secara automatik model AI yang diperlukan, dan kemudian terus memanggil model yang sepadan pada HuggingFace untuk membantu anda melaksanakan dan menyelesaikannya.
Dalam keseluruhan proses, anda hanya perlu mengeluarkan keperluan anda dalam bahasa semula jadi.
Hasil kerjasama antara Universiti Zhejiang dan Microsoft Research Asia ini dengan cepat menjadi popular sebaik sahaja ia dikeluarkan.
Saintis penyelidikan AI Nvidia Jim Fan berkata secara langsung:
Ini adalah kertas kerja paling menarik yang saya baca minggu ini. Ideanya sangat dekat dengan "Apl Semuanya" (semuanya adalah Apl, dan maklumat dibaca terus oleh AI).
Seorang netizen menampar pahanya terus:
Bukankah ini "lelaki suis" ChatGPT?
AI berkembang pesat, meninggalkan kita sesuatu untuk dimakan...
Jadi, apa sebenarnya yang berlaku?
Sebenarnya, jika gabungan ini hanyalah "Hugging Man", ia akan menjadi terlalu kecil.
Maksud sebenar ialah AGI.
Seperti yang penulis katakan, langkah utama ke arah AGI ialah keupayaan untuk menyelesaikan tugas AI yang kompleks dengan domain dan mod yang berbeza.
Hasil semasa kami masih jauh dari ini - sebilangan besar model hanya boleh melaksanakan tugas tertentu dengan baik.
Namun, prestasi model bahasa besar LLM dalam pemahaman, penjanaan, interaksi dan penaakulan bahasa membuatkan penulis berfikir:
Ia boleh digunakan sebagai pengawal perantaraan untuk mengurus semua model AI sedia ada, dengan "menggerakkan dan menggabungkan kuasa semua orang" untuk menyelesaikan tugas AI yang kompleks.
Dalam sistem ini, bahasa ialah antara muka universal.
Jadi, lahirlah HuggingGPT.
Proses kejuruteraannya terbahagi kepada empat langkah:
Pertama, perancangan misi. ChatGPT menghuraikan keperluan pengguna ke dalam senarai tugas dan menentukan urutan pelaksanaan dan kebergantungan sumber antara tugas.
Kedua, pemilihan model. ChatGPT memperuntukkan model yang sesuai kepada tugas berdasarkan penerangan setiap model pakar yang dihoskan pada HuggingFace.
Kemudian, tugasan dilaksanakan. Model pakar yang dipilih pada titik akhir hibrid (termasuk inferens tempatan dan inferens HuggingFace) melaksanakan tugasan yang diperuntukkan mengikut urutan tugasan dan kebergantungan, dan memberikan maklumat dan keputusan pelaksanaan kepada ChatGPT.
Akhir sekali, keluarkan hasilnya. ChatGPT meringkaskan log proses pelaksanaan dan keputusan inferens setiap model dan memberikan output akhir.
Seperti yang ditunjukkan dalam gambar di bawah.
Seandainya kita memberikan permintaan sedemikian:
Sila hasilkan gambar seorang gadis sedang membaca buku, posturnya adalah sama seperti lelaki dalam contoh.jpg. Kemudian gunakan suara anda untuk menerangkan imej baharu.
Anda boleh melihat cara HuggingGPT menguraikannya kepada 6 subtugasan dan memilih model untuk dilaksanakan masing-masing untuk mendapatkan hasil akhir.
Apakah kesan khusus?
Pengarang menjalankan pengukuran sebenar menggunakan gpt-3.5-turbo dan text-davinci-003, dua varian yang boleh diakses secara umum melalui OpenAI API.
Seperti yang ditunjukkan dalam rajah di bawah:
Apabila terdapat kebergantungan sumber antara tugas, HuggingGPT boleh menghuraikan tugas tertentu dengan betul mengikut permintaan abstrak pengguna dan melengkapkan penukaran imej.
Dalam tugasan audio dan video, ia juga menunjukkan keupayaan untuk mengatur kerjasama antara model, dengan melaksanakan dua model secara selari dan bersiri masing-masing, Selesai video dan alih suara karya "Angkasawan Berjalan di Angkasa".
Selain itu, ia juga boleh menyepadukan sumber input daripada berbilang pengguna untuk melakukan penaakulan mudah, seperti mengira berapa banyak zebra yang terdapat dalam tiga gambar berikut.
Ringkasan satu ayat: HuggingGPT boleh menunjukkan prestasi yang baik dalam pelbagai bentuk tugasan yang kompleks.
Pada masa ini, kertas HuggingGPT telah dikeluarkan dan projek itu sedang dalam pembinaan Hanya sebahagian daripada kod tersebut telah bersumberkan terbuka menerima 1.4k bintang.
Kami mendapati bahawa nama projeknya sangat menarik Ia tidak dipanggil HuggingGPT, tetapi AI butler JARVIS dalam Iron Man.
Sesetengah orang mendapati bahawa ia sangat serupa dengan idea Visual ChatGPT yang baru dikeluarkan pada bulan Mac: HuggingGPT yang terakhir, terutamanya skop model boleh panggil telah dikembangkan kepada lebih banyak lagi, Termasuk kuantiti dan jenis.
Ya, sebenarnya, mereka semua mempunyai pengarang yang sama: Microsoft Asia Research Institute.
Secara khusus, pengarang pertama Visual ChatGPT ialah penyelidik kanan MSRA Wu Chenfei, dan pengarang yang sepadan ialah ketua penyelidik MSRA Duan Nan.
HuggingGPT termasuk dua pengarang bersama:
Shen Yongliang, yang berasal dari Universiti Zhejiang dan menyelesaikan kerja ini semasa latihan di MSRA
Song Kaitao, seorang penyelidik di MSRA .
Pengarang yang sepadan ialah Zhuang Yueting, profesor Jabatan Sains Komputer di Universiti Zhejiang.
Akhirnya, netizen sangat teruja dengan kelahiran alat baharu yang berkuasa ini Beberapa orang berkata:
ChatGPT telah menjadi a manusia Cipta komander keseluruhan bagi semua AI.
Sesetengah orang juga berfikir berdasarkan ini:
AGI mungkin bukan LLM, tetapi "perantara" LLM Sambungkan berbilang model yang saling berkaitan.
Jadi, sudahkah kita memulakan era "semi-AGI"?
Alamat kertas: https://www.php.cn/link/1ecdec353419f6d7e30857d00d0312d1>https://www.php.cn/link/859555c74e9afd45ab771c615c1e49a6
Pautan rujukan:https://www.php.cn/ pautan/62d2b7ba91f34c0ac08aa11c359a8d2c
Atas ialah kandungan terperinci HuggingGPT adalah popular: ChatGPT mengawal semua model AI dan secara automatik membantu orang menyelesaikan tugas AI. Netizen: Biarkan mulut anda makan.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!