lokasi sekarang:Rumah > Artikel teknikal > Peranti teknologi > AI
- Arah:
- semua web3.0 pembangunan bahagian belakang hujung hadapan web pangkalan data Operasi dan penyelenggaraan alat pembangunan rangka kerja php pengaturcaraan harian applet WeChat masalah biasa lain teknologi Tutorial CMS Java Tutorial sistem tutorial komputer Tutorial Perkakasan Tutorial mudah alih Tutorial perisian Tutorial permainan mudah alih
- Mengelaskan:
-
- Mengalahkan Gemini-1.5-Pro dan GPT-4V, kedudukan antara tiga teratas di dunia dalam keupayaan pelbagai mod model besar
- Baru-baru ini, model besar Yuncong Technology telah mencapai kemajuan yang ketara dalam bidang penilaian pelbagai mod OpenCompass, platform penilaian komprehensif yang berwibawa. Keputusan penilaian terkini menunjukkan bahawa skor purata model besar Congrong Yuncong Technology dalam sistem ini ialah 65.5 Keputusan ini meletakkan model besar Congrong ke dalam tiga teratas di dunia, mengatasi Gemini-1.5-Pro dan GPT-4v Google. kedudukan kedua Pada GPT-4o (69.9) dan Claude3.5-Sonnet (67.9). Di pasaran domestik, prestasi model besar itu juga melebihi InternVL-Chat (61.7) dan GLM-4V (60.8), menduduki tempat pertama. 1. Senarai berbilang modal OpenCompass OpenCom
- AI 1053 2024-06-29 00:25:01
-
- Pasukan Bengio mencadangkan penanda aras pelbagai mod baharu, menyasarkan kelemahan Claude 3.5 dan GPT-4o
- Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Penulis artikel ini, Zhang Tianyu, belajar di Institut Kecerdasan Buatan Mila di Kanada dan belajar di bawah Profesor Yoshua Bengio, pemenang Anugerah Turing. Kerja utama semasa tempoh kedoktoran tertumpu pada pelbagai modaliti, GFlowNet, pembelajaran pengukuhan pelbagai ejen, AI dan perubahan iklim
- AI 852 2024-06-29 00:06:53
-
- Model Depth Anything V2 pasukan model Byte telah dipilih sebagai model CoreML terbaru Apple
- Baru-baru ini, Apple mengeluarkan 20 model CoreML baharu dan 4 set data pada HuggingFace, dan model anggaran kedalaman monokular DepthAnythingV2 daripada Pasukan Model Byte telah dipilih antaranya. Rangka kerja pembelajaran mesin CoreML Apple digunakan untuk menyepadukan model pembelajaran mesin ke dalam peranti seperti iOS dan MacOS untuk berjalan dengan cekap. Laksanakan tugas AI yang kompleks tanpa memerlukan sambungan internet, tingkatkan privasi pengguna dan kurangkan kependaman. Pembangun Apple boleh menggunakan model ini untuk membina aplikasi AI yang pintar dan selamat. Model anggaran kedalaman monokular yang dibangunkan oleh pasukan model besar DepthAnythingV2 byte. Versi V2 mempunyai pemprosesan butiran yang lebih halus, keteguhan yang lebih kukuh dan kelajuan yang dipertingkatkan dengan ketara. Mengandungi 25M hingga
- AI 529 2024-06-28 22:40:06
-
- Tukar imej kepada teks secara automatik dan penerangan imej adalah berkualiti tinggi dan lebih tepat.
- Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Pi Renjie: pelajar kedoktoran tahun ketiga di Universiti Sains dan Teknologi Hong Kong, belajar di bawah Profesor Zhang Tong dan Profesor Zhou Xiaofang. Menerima Biasiswa Apple pada 2024. Arah penyelidikan utama semasa ialah model bahasa besar berbilang modal dan AI berpusatkan data. Zhang Jianshu: pelajar tahun ketiga sarjana muda di Universiti Wuhan,
- AI 971 2024-06-28 21:41:35
-
- Kelahiran Cambrian No. 1: Pasukan Xie Saining dan Yann LeCun mengeluarkan LLM berbilang modal sumber terbuka yang paling berkuasa
- Sama seperti haiwan mempunyai mata, Cambrian-1 daripada pasukan Yann LeCun membolehkan AI memperoleh keupayaan pembelajaran perwakilan visual yang berkuasa. Sepanjang zaman, ramai ahli falsafah telah meneroka persoalan ini: Adakah pemahaman makna bahasa perlu berdasarkan pancaindera? Walaupun ahli falsafah tidak bersetuju, satu perkara yang jelas: asas deria yang kukuh dan berkesan sekurang-kurangnya dapat membantu. Sebagai contoh, para saintis secara amnya percaya bahawa kemunculan penglihatan semasa Letupan Cambrian merupakan langkah penting dalam evolusi haiwan awal ia bukan sahaja membantu haiwan mencari makanan dengan lebih baik dan mengelakkan pemangsa, tetapi juga membantu evolusi haiwan itu sendiri; Sebenarnya, kebanyakan pengetahuan manusia (dan hampir semua haiwan) diperolehi melalui pengalaman deria yang berinteraksi dengan fizikal.
- AI 1304 2024-06-28 21:28:07
-
- Model besar domestik mencapai ketinggian baharu! iFlytek Spark 4.0 dikeluarkan: keseluruhannya mengatasi GPT-4 Turbo, menduduki tempat pertama dalam 8 set ujian berwibawa antarabangsa
- Keupayaan model besar domestik telah mencapai tahap yang baru! Pada 27 Jun, iFlytek secara rasmi mengeluarkan model iFlytek Spark V4.0, serta aplikasi kecerdasan buatan dalam banyak bidang seperti penjagaan perubatan, pendidikan dan perniagaan. Dengan keluaran versi baharu, tujuh keupayaan teras iFlytek Spark V4.0 telah dinaik taraf sepenuhnya, menduduki tempat pertama dalam 8 set ujian arus perdana antarabangsa, secara keseluruhannya mengatasi GPT-4Turbo, dan menerajui model besar domestik. Liu Qingfeng berkata pada masa ini, jumlah muat turun Spark APP telah mencecah 131 juta, dan beberapa pembantu aplikasi kegemaran pengguna telah muncul. Dengan sokongan model Spark, jualan perkakasan pintar dalam beberapa senario meningkat sebanyak 70%+ tahun ke tahun, dengan purata penggunaan bulanan melebihi 40 juta. Selain itu, model besar Xinghuo V4.0 adalah berdasarkan Wanka domestik pertama di negara ini
- AI 1135 2024-06-28 20:52:47
-
- Teknologi penjanaan video AI masa nyata pertama dalam sejarah: DiT universal, 10.6 kali lebih pantas
- DiT boleh digunakan untuk menjana video tanpa kehilangan kualiti dan latihan tidak diperlukan. Penjanaan video AI masa nyata ada di sini! Pada hari Rabu, pasukan You Yang Universiti Nasional Singapura mencadangkan kaedah penjanaan video berasaskan DiT pertama dalam industri yang boleh dikeluarkan dalam masa nyata. Teknologi itu dipanggil PyramidAttentionBroadcast (PAB). Dengan mengurangkan pengiraan perhatian yang berlebihan, PAB mencapai kadar bingkai sehingga 21.6FPS dan kelajuan 10.6x tanpa mengorbankan faedah model penjanaan video berasaskan DiT yang popular termasuk kualiti Open-Sora, Open-Sora-Plan dan Latte. Perlu diingat bahawa sebagai kaedah yang tidak memerlukan latihan, PAB boleh digunakan untuk mana-mana berasaskan DiT masa hadapan
- AI 1437 2024-06-28 19:14:46
-
- Tsinghua AIR dan lain-lain mencadangkan ESM-AA, model bahasa protein pertama daripada asid amino kepada skala atom
- Pasukan penyelidik dari Universiti Tsinghua AIR, Universiti Peking, dan Universiti Nanjing mencadangkan model ESM-AA. Model ini telah mencapai kemajuan penting dalam bidang pemodelan bahasa protein, menyediakan penyelesaian pemodelan bersatu yang menyepadukan maklumat berbilang skala. Ia adalah model bahasa pra-latihan protein pertama yang boleh mengendalikan kedua-dua maklumat asid amino dan maklumat atom. Prestasi cemerlang model menunjukkan potensi besar pemodelan bersatu berbilang skala untuk mengatasi had sedia ada dan membuka kunci keupayaan baharu. Sebagai model asas, ESM-AA telah mendapat perhatian dan perbincangan meluas daripada ramai sarjana (lihat tangkapan skrin di bawah Ia dianggap berpotensi untuk membangunkan model berdasarkan ESM-AA yang boleh bersaing dengan AlphaFold3 dan RoseTTAFoldAll-Atom, dan menyediakan). platform untuk mengkaji fasa organisma yang berbeza antara struktur
- AI 1323 2024-06-28 18:10:06
-
- Cekap dan tepat, pasukan Universiti Zhengzhou membangunkan alat AI baharu untuk mengenal pasti interaksi sasaran dadah
- Editor |. Rama-rama Daun Kering Pengenalpastian tepat interaksi sasaran dadah (DTI) ialah salah satu langkah utama dalam penemuan ubat dan proses penempatan semula ubat. Pada masa ini, banyak model berasaskan pengiraan telah dicadangkan untuk meramalkan DTI, dan beberapa kemajuan ketara telah dicapai. Walau bagaimanapun, kaedah ini jarang memberi tumpuan kepada cara menggabungkan rangkaian persamaan berbilang paparan yang berkaitan dengan ubat dan sasaran dengan cara yang sesuai. Tambahan pula, cara untuk menggabungkan sepenuhnya hubungan interaksi yang diketahui untuk mewakili ubat dan sasaran dengan tepat belum dikaji dengan baik. Oleh itu, meningkatkan ketepatan model ramalan DTI masih perlu. Dalam penyelidikan terkini, pasukan dari Universiti Zhengzhou dan Universiti Sains dan Teknologi Elektronik China mencadangkan kaedah baharu, MIDTI. Kaedah ini menggunakan strategi gabungan rangkaian persamaan pelbagai pandangan dan mekanisme perhatian interaktif yang mendalam untuk meramalkan dadah.
- AI 1210 2024-06-28 02:31:25
-
- Disesuaikan khusus untuk lima bidang saintifik utama, NASA dan IBM bekerjasama untuk membangunkan model bahasa besar INDUS
- INDUS, dinamakan sempena buruj selatan, ialah set komprehensif model bahasa berskala besar yang menyokong lima bidang saintifik. (Sumber: NASA) Editor |. Model bahasa besar (LLM) KX yang dilatih pada sejumlah besar data berprestasi baik pada pemahaman bahasa semula jadi dan tugas penjanaan. Kebanyakan LLM popular dilatih menggunakan korpora am seperti Wikipedia, tetapi perubahan pengedaran perbendaharaan kata membawa kepada prestasi yang lemah dalam domain tertentu. Diilhamkan oleh ini, NASA bekerjasama dengan IBM untuk membangunkan INDUS, satu set komprehensif LLM yang disesuaikan untuk bidang sains Bumi, biologi, fizik, heliofizik, sains planet dan astrofizik serta menggunakan data daripada sumber data saintifik yang dipilih susun yang berbeza digunakan. untuk latihan. INDUS mengandungi dua jenis model: pengekod dan ayat
- AI 928 2024-06-27 20:28:32
-
- OpenAI tiba-tiba memotong bekalan ke China! SenseTime melancarkan 'perkhidmatan pemindahan' kos sifar dan disertakan dengan pakej hadiah yang besar
- Pada 25 Jun, SenseTime Technology mengumumkan pelancaran pelan pembelian 0 yuan untuk model bernilai besar Mulai sekarang, menjadi pengguna perusahaan yang baru berdaftar bagi "SenseNova" SenseTime akan menerima pakej perkhidmatan percuma yang melibatkan panggilan, migrasi, latihan, dsb. , 0 yuan GO! Platform "RiRiXin SenseNova" merangkumi pelbagai jenis antara muka API model, termasuk model bahasa perundingan, grafik perundingan dan model pelbagai mod teks, model imej berasaskan teks Miaohua, model pertuturan, model vektor, dll., untuk memenuhi keperluan yang berbeza bagi pengguna perusahaan. SenseTime sentiasa menegaskan keaslian AI, keselamatan teknologi, kebolehkawalan bebas dan infrastruktur AI generasi baharunya yang canggih, kos rendah, berskala besar seperti SenseCore, yang telah menjamin kuasa pengkomputeran. Shang Tangjiang
- AI 578 2024-06-27 00:23:50
-
- Mensimulasikan 500 juta tahun maklumat evolusi, ia merupakan model biologi berskala besar pertama yang secara serentak menyimpulkan urutan, struktur dan fungsi protein.
- Editor |. Sepanjang **panjang** tiga bilion tahun evolusi semula jadi, **bentuk** protein **sedia ada telah terbentuk dan melalui proses pemilihan semula jadi yang panjang. Evolusi adalah seperti eksperimen selari yang dijalankan pada skala masa geologi, melalui mutasi rawak dan mekanisme pemilihan, menapis mengikut urutan, struktur dan fungsi protein. , di sini penyelidik di EvolutionaryScale menunjukkan bahawa model bahasa yang dilatih pada penanda yang dihasilkan oleh evolusi boleh berfungsi sebagai simulator evolusi untuk menjana protein berfungsi yang berbeza daripada urutan protein yang diketahui. , penyelidik mencadangkan **termaju** ESM3, model bahasa generatif berbilang mod **maju** yang boleh membuat alasan tentang protein
- AI 1092 2024-06-26 20:40:11
-
- Telinga saya betul, bunyinya terlalu nyata, teknologi Seed-TTS bagi sintesis pertuturan Byte Beanbao didedahkan
- Seed-TTS ialah model penjanaan pertuturan berskala besar yang dikeluarkan baru-baru ini oleh pasukan model ByteDance Doubao. , pertuturan yang dihasilkannya hampir **tidak berbeza** dengan orang sebenar, malah sebutan **kecacatan** boleh dihasilkan, terutamanya dari segi pembelajaran meniru pertuturan manusia, dengan kedua-dua **kesetiaan** dan **kelancaran **. **Prestasi menakjubkan. Sebagai contoh, jika anda memberikan sepotong ucapan kepada Seed-TTS, ia boleh menghasilkan ucapan baharu berdasarkan teks dan membawa ciri bunyi bahan asal. Bahan asal (Prompt): Suara Cina yang dihasilkan oleh Seed-TTS: Tiba-tiba, kedengaran ketawa di sekeliling saya. Saya memandang mereka, meluruskan dada saya dengan semangat yang tinggi, menggoyangkan lengan saya yang sedikit berisi, dan ketawa: "Daging di badan saya adalah untuk menutup pesona saya yang luar biasa, jika tidak.
- AI 1189 2024-06-26 20:37:12
-
- NetEase Fuxi akan muncul di WAIC 2024 dengan pencapaian yang inovatif, lihatlah sorotan!
- Persidangan Kepintaran Buatan Dunia 2024 dan Persidangan Peringkat Tinggi mengenai Tadbir Urus Global Kepintaran Buatan (dirujuk sebagai "WAIC 2024") akan dibuka di Shanghai pada 4 Julai. Sebagai peneraju dalam bidang kecerdasan buatan di China, NetEase Fuxi akan membawakan produk terasnya - NetEase Yaotai, NetEase Smart, Youling Platform, Danqingyue dan Game AI untuk semua muncul di WAIC 2024 untuk menunjukkan sepenuhnya teknologi canggihnya dalam bidang kecerdasan buatan dan hasil aplikasi. 1. Ruang besar NetEase Yaotai VR: debut industri, membina semula ruang baharu untuk pengalaman yang mengasyikkan Di gerai NetEase Fuxi di WAIC 2024, NetEase Yaotai akan memaparkan ruang VR perusahaan besar pertama dalam industri, dengan mengejutkan mempersembahkan "**infinite*" daripada. VR perusahaan *"Konsep Dewan Pameran. Dalam ruang seluas 20 meter persegi sahaja, pembesaran dewan pameran berbilang tingkat itu direalisasikan.
- AI 511 2024-06-26 18:42:22
-
- Institut Penyelidikan Pengimejan Meitu (MT Lab) memenangi 3 anugerah persidangan kecerdasan buatan antarabangsa teratas
- Pada 30 Mei, Pemahaman Video Peringkat Pixel ke-3 di Alam Liar, PVUW (selepas ini dirujuk sebagai PVUW) yang diadakan oleh CVPR2024, persidangan kecerdasan buatan antarabangsa terkemuka, mengumumkan keputusan pertandingan Meitu Imaging Research Institute (MTLab) memenangi satu lagi Memenangi tempat kedua dalam trek Video Semantic Segmentation (VSS) dan Complex Scene Video Object Segmentation (MOSE), dan tempat ketiga dalam Video Panoramic Segmentation Challenge (VPS) Ini juga merupakan kali ketiga Institut Penyelidikan Pengimejan Meitu (MTLab ) telah memenangi persidangan CVPR Memenangi anugerah dan mencapai keputusan cemerlang 1 emas, 3 perak dan 3 gangsa. Sebagai acara teratas dalam bidang penglihatan komputer di seluruh dunia,
- AI 888 2024-06-26 17:13:20