Yancore Digital mengeluarkan model mekanisme bukan Perhatian berskala besar yang menyokong penggunaan sisi peranti luar talian-AI-php.cn

Rumah

Yancore Digital mengeluarkan model mekanisme bukan Perhatian berskala besar yang menyokong penggunaan sisi peranti luar talian

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 26, 2024 am 08:24 AM

bermula

Pada 24 Januari, Shanghai Yanxinshuzhi Artificial Intelligence Technology Co., Ltd. melancarkan model bahasa semula jadi umum yang besar tanpa model Perhatian mekanisme-Yan. Menurut sidang akhbar Yancore Digital Intelligence, model Yan menggunakan "seni bina Yan" yang dibangunkan sendiri untuk menggantikan seni bina Transformer Berbanding dengan Transformer, seni bina Yan mempunyai kapasiti memori meningkat sebanyak 3 kali, kelajuan meningkat sebanyak 7 kali, dan pada masa yang sama, ia boleh mencapai hasil inferens 5 kali peningkatan. Yancore Digital mengeluarkan model mekanisme bukan Perhatian berskala besar yang menyokong penggunaan sisi peranti luar talian Liu Fanping, Ketua Pegawai Eksekutif Yancore Digital Intelligence, percaya bahawa Transformer, yang terkenal dengan skala besar, mempunyai kuasa pengkomputeran yang tinggi dan kos yang tinggi dalam aplikasi praktikal, yang telah menghalang banyak perusahaan kecil dan sederhana. Kerumitan seni bina dalamannya menjadikan proses membuat keputusan sukar untuk dijelaskan; kesukaran dalam memproses urutan panjang dan masalah halusinasi yang tidak terkawal juga mengehadkan penggunaan luas model besar dalam bidang utama dan senario khas tertentu. Dengan mempopularkan pengkomputeran awan dan pengkomputeran tepi, permintaan industri untuk model AI berskala besar dengan prestasi tinggi dan penggunaan tenaga yang rendah semakin meningkat.
"Di peringkat global, ramai penyelidik cemerlang telah cuba menyelesaikan secara asasnya pergantungan yang berlebihan pada seni bina Transformer dan mencari cara yang lebih baik untuk menggantikan Transformer. Malah Llion Jones, salah seorang pengarang kertas Transformer, juga meneroka 'Kemungkinan selepas Transformer' cuba menggunakan kaedah pintar yang diilhamkan oleh alam semula jadi berdasarkan prinsip evolusi untuk mencipta definisi semula rangka kerja AI dari sudut yang berbeza."
Pada sidang akhbar itu, Core Digital berkata bahawa di bawah keadaan sumber yang sama, Kecekapan latihan dan hasil inferens model seni bina Yan adalah 7 kali ganda dan 5 kali ganda daripada seni bina Transformer, dan kapasiti memori dipertingkatkan sebanyak 3 kali ganda. Reka bentuk seni bina Yan menjadikan kerumitan ruang model Yan malar semasa inferens Oleh itu, model Yan juga berprestasi baik terhadap masalah jujukan panjang yang dihadapi oleh Transformer. Data perbandingan menunjukkan bahawa pada satu kad grafik 4090 24G, apabila panjang token keluaran model melebihi 2600, model Transformer akan mengalami memori video yang tidak mencukupi, manakala penggunaan memori video model Yan sentiasa stabil pada sekitar 14G, yang mana secara teorinya membolehkan inferens panjang tak terhingga.

Yancore Digital mengeluarkan model mekanisme bukan Perhatian berskala besar yang menyokong penggunaan sisi peranti luar talian

Selain itu, pasukan penyelidik mempelopori fungsi ciri korelasi yang munasabah dan pengendali ingatan, digabungkan dengan kaedah pengiraan linear, untuk mengurangkan kerumitan struktur dalaman model. Model Yan di bawah seni bina baharu akan membuka "kotak hitam yang tidak boleh ditafsirkan" pemprosesan bahasa semula jadi pada masa lalu, meneroka sepenuhnya ketelusan dan kebolehjelasan proses membuat keputusan, dan dengan itu memudahkan penggunaan meluas model besar dalam bidang berisiko tinggi seperti penjagaan perubatan, kewangan, dan undang-undang.

Yancore Digital mengeluarkan model mekanisme bukan Perhatian berskala besar yang menyokong penggunaan sisi peranti luar talian

Liu Fanping berkata bahawa model Yan 100% menyokong aplikasi penempatan yang diswastakan dan boleh berjalan tanpa rugi pada peranti sisi hujung seperti CPU gred pengguna arus perdana tanpa keratan atau pemampatan, mencapai kesan yang sama seperti model lain yang dijalankan pada GPU. Pada sidang akhbar itu, Yan menunjukkan klip masa nyata yang berjalan pada komputer riba selepas berada di luar talian Liu Fanping berkata bahawa penggunaan bahagian hujung luar talian akan menjadi hala tuju pengkomersialan yang penting bagi Perisikan Teras pada masa hadapan.

Atas ialah kandungan terperinci Yancore Digital mengeluarkan model mekanisme bukan Perhatian berskala besar yang menyokong penggunaan sisi peranti luar talian. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

4 minggu yang lalu By DDD

Panduan Atomfall: Lokasi Item, Panduan Pencarian, dan Petua

4 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7667

Tutorial CakePHP

1393

Tutorial C#

1205

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Tunjukkan Lagi

Related knowledge

Tutorial Model Penyebaran Bernilai Masa Anda, dari Universiti Purdue Apr 07, 2024 am 09:01 AM

Penyebaran bukan sahaja boleh meniru lebih baik, tetapi juga "mencipta". Model resapan (DiffusionModel) ialah model penjanaan imej. Berbanding dengan algoritma yang terkenal seperti GAN dan VAE dalam bidang AI, model resapan mengambil pendekatan yang berbeza. Idea utamanya ialah proses menambah hingar pada imej dan kemudian secara beransur-ansur menolaknya. Cara mengecilkan dan memulihkan imej asal adalah bahagian teras algoritma. Algoritma akhir mampu menghasilkan imej daripada imej bising rawak. Dalam beberapa tahun kebelakangan ini, pertumbuhan luar biasa AI generatif telah membolehkan banyak aplikasi menarik dalam penjanaan teks ke imej, penjanaan video dan banyak lagi. Prinsip asas di sebalik alat generatif ini ialah konsep resapan, mekanisme pensampelan khas yang mengatasi batasan kaedah sebelumnya.

Hasilkan PPT dengan satu klik! Kimi: Biarlah 'pekerja migran PPT' menjadi popular dahulu Aug 01, 2024 pm 03:28 PM

Kimi: Hanya dalam satu ayat, dalam sepuluh saat sahaja, PPT akan siap. PPT sangat menjengkelkan! Untuk mengadakan mesyuarat, anda perlu mempunyai PPT; untuk menulis laporan mingguan, anda perlu mempunyai PPT untuk membuat pelaburan, anda perlu menunjukkan PPT walaupun anda menuduh seseorang menipu, anda perlu menghantar PPT. Kolej lebih seperti belajar jurusan PPT Anda menonton PPT di dalam kelas dan melakukan PPT selepas kelas. Mungkin, apabila Dennis Austin mencipta PPT 37 tahun lalu, dia tidak menyangka satu hari nanti PPT akan berleluasa. Bercakap tentang pengalaman sukar kami membuat PPT membuatkan kami menitiskan air mata. "Ia mengambil masa tiga bulan untuk membuat PPT lebih daripada 20 muka surat, dan saya menyemaknya berpuluh-puluh kali. Saya rasa ingin muntah apabila saya melihat PPT itu." ialah PPT." Jika anda mengadakan mesyuarat dadakan, anda harus melakukannya

Semua anugerah CVPR 2024 diumumkan! Hampir 10,000 orang menghadiri persidangan itu di luar talian dan seorang penyelidik Cina dari Google memenangi anugerah kertas terbaik Jun 20, 2024 pm 05:43 PM

Pada awal pagi 20 Jun, waktu Beijing, CVPR2024, persidangan penglihatan komputer antarabangsa teratas yang diadakan di Seattle, secara rasmi mengumumkan kertas kerja terbaik dan anugerah lain. Pada tahun ini, sebanyak 10 kertas memenangi anugerah, termasuk 2 kertas terbaik dan 2 kertas pelajar terbaik Selain itu, terdapat 2 pencalonan kertas terbaik dan 4 pencalonan kertas pelajar terbaik. Persidangan teratas dalam bidang visi komputer (CV) ialah CVPR, yang menarik sejumlah besar institusi penyelidikan dan universiti setiap tahun. Mengikut statistik, sebanyak 11,532 kertas telah diserahkan tahun ini, 2,719 daripadanya diterima, dengan kadar penerimaan 23.6%. Menurut analisis statistik data CVPR2024 Institut Teknologi Georgia, dari perspektif topik penyelidikan, bilangan kertas terbesar ialah sintesis dan penjanaan imej dan video (Imageandvideosyn

Daripada logam kosong kepada model besar dengan 70 bilion parameter, berikut ialah tutorial dan skrip sedia untuk digunakan Jul 24, 2024 pm 08:13 PM

Kami tahu bahawa LLM dilatih pada kelompok komputer berskala besar menggunakan data besar-besaran Tapak ini telah memperkenalkan banyak kaedah dan teknologi yang digunakan untuk membantu dan menambah baik proses latihan LLM. Hari ini, perkara yang ingin kami kongsikan ialah artikel yang mendalami teknologi asas dan memperkenalkan cara menukar sekumpulan "logam kosong" tanpa sistem pengendalian pun menjadi gugusan komputer untuk latihan LLM. Artikel ini datang daripada Imbue, sebuah permulaan AI yang berusaha untuk mencapai kecerdasan am dengan memahami cara mesin berfikir. Sudah tentu, mengubah sekumpulan "logam kosong" tanpa sistem pengendalian menjadi gugusan komputer untuk latihan LLM bukanlah proses yang mudah, penuh dengan penerokaan dan percubaan dan kesilapan, tetapi Imbue akhirnya berjaya melatih LLM dengan 70 bilion parameter proses terkumpul

Panduan Pemasangan PyCharm Edisi Komuniti: Kuasai semua langkah dengan cepat Jan 27, 2024 am 09:10 AM

Mula Pantas dengan PyCharm Edisi Komuniti: Tutorial Pemasangan Terperinci Analisis Penuh Pengenalan: PyCharm ialah persekitaran pembangunan bersepadu (IDE) Python yang berkuasa yang menyediakan set alat yang komprehensif untuk membantu pembangun menulis kod Python dengan lebih cekap. Artikel ini akan memperkenalkan secara terperinci cara memasang Edisi Komuniti PyCharm dan menyediakan contoh kod khusus untuk membantu pemula bermula dengan cepat. Langkah 1: Muat turun dan pasang Edisi Komuniti PyCharm Untuk menggunakan PyCharm, anda perlu memuat turunnya dari tapak web rasminya terlebih dahulu

AI sedang digunakan |. AI mencipta vlog kehidupan seorang gadis yang tinggal bersendirian, yang menerima berpuluh ribu suka dalam masa 3 hari Aug 07, 2024 pm 10:53 PM

Editor Laporan Kuasa Mesin: Yang Wen Gelombang kecerdasan buatan yang diwakili oleh model besar dan AIGC telah mengubah cara kita hidup dan bekerja secara senyap-senyap, tetapi kebanyakan orang masih tidak tahu cara menggunakannya. Oleh itu, kami telah melancarkan lajur "AI dalam Penggunaan" untuk memperkenalkan secara terperinci cara menggunakan AI melalui kes penggunaan kecerdasan buatan yang intuitif, menarik dan padat serta merangsang pemikiran semua orang. Kami juga mengalu-alukan pembaca untuk menyerahkan kes penggunaan yang inovatif dan praktikal. Pautan video: https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ Baru-baru ini, vlog kehidupan seorang gadis yang tinggal bersendirian menjadi popular di Xiaohongshu. Animasi gaya ilustrasi, ditambah dengan beberapa perkataan penyembuhan, boleh diambil dengan mudah dalam beberapa hari sahaja.

Lima perisian pengaturcaraan untuk memulakan pembelajaran bahasa C Feb 19, 2024 pm 04:51 PM

Sebagai bahasa pengaturcaraan yang digunakan secara meluas, bahasa C merupakan salah satu bahasa asas yang mesti dipelajari bagi mereka yang ingin melibatkan diri dalam pengaturcaraan komputer. Walau bagaimanapun, bagi pemula, mempelajari bahasa pengaturcaraan baharu boleh menjadi sukar, terutamanya disebabkan kekurangan alat pembelajaran dan bahan pengajaran yang berkaitan. Dalam artikel ini, saya akan memperkenalkan lima perisian pengaturcaraan untuk membantu pemula memulakan bahasa C dan membantu anda bermula dengan cepat. Perisian pengaturcaraan pertama ialah Code::Blocks. Code::Blocks ialah persekitaran pembangunan bersepadu sumber terbuka (IDE) percuma untuk

Mesti dibaca untuk pemula teknikal: Analisis tahap kesukaran bahasa C dan Python Mar 22, 2024 am 10:21 AM

Tajuk: Wajib dibaca untuk pemula teknikal: Analisis kesukaran bahasa C dan Python, memerlukan contoh kod khusus Dalam era digital hari ini, teknologi pengaturcaraan telah menjadi keupayaan yang semakin penting. Sama ada anda ingin bekerja dalam bidang seperti pembangunan perisian, analisis data, kecerdasan buatan, atau hanya belajar pengaturcaraan kerana minat, memilih bahasa pengaturcaraan yang sesuai ialah langkah pertama. Di antara banyak bahasa pengaturcaraan, bahasa C dan Python adalah dua bahasa pengaturcaraan yang digunakan secara meluas, masing-masing mempunyai ciri tersendiri. Artikel ini akan menganalisis tahap kesukaran bahasa C dan Python

See all articles