Penyelesaian persekitaran terbuka yang menyelesaikan kekurangan seperti lapisan Batch Norm-AI-php.cn

Jadual Kandungan

Artikel ini menganalisis sebab TTA gagal dalam banyak senario liar dari perspektif bersatu, dan kemudian menyediakan penyelesaian.

Penilaian eksperimen

Kesimpulan

Rumah

Peranti teknologi

Penyelesaian persekitaran terbuka yang menyelesaikan kekurangan seperti lapisan Batch Norm

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 26, 2023 am 10:01 AM

teknologi membangun

Kaedah Penyesuaian Masa Ujian (TTA) membimbing model untuk melaksanakan pembelajaran tanpa penyeliaan/penyeliaan kendiri yang pantas semasa fasa ujian Ia kini merupakan alat yang berkuasa dan berkesan untuk meningkatkan keupayaan generalisasi luar pengedaran model mendalam. Walau bagaimanapun, dalam senario terbuka dinamik, kestabilan yang tidak mencukupi masih merupakan kelemahan utama kaedah TTA sedia ada, yang secara serius menghalang penggunaan praktikal mereka. Untuk tujuan ini, pasukan penyelidik dari Universiti Teknologi China Selatan, Tencent AI Lab dan Universiti Nasional Singapura menganalisis sebab kaedah TTA sedia ada tidak stabil dalam senario dinamik dari perspektif bersatu, dan menunjukkan bahawa lapisan normalisasi yang bergantung on Batch membawa kepada ketidakstabilan Salah satu sebab utama untuk kestabilan, di samping itu, beberapa sampel dengan kecerunan bunyi/berskala besar dalam aliran data ujian boleh mengoptimumkan model dengan mudah kepada penyelesaian remeh yang merosot. Berdasarkan ini, kaedah pengecilan entropi masa ujian yang sensitif ketajaman dan boleh dipercayai SAR selanjutnya dicadangkan untuk mencapai migrasi dan generalisasi dalam talian model masa ujian yang stabil dan cekap dalam senario terbuka dinamik. Karya ini telah dipilih ke dalam ICLR 2023 Oral (Top-5% antara kertas yang diterima).

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Tajuk kertas: Ke Arah Penyesuaian Masa Ujian Stabil dalam Dunia Liar Dinamik
Alamat kertas: https://openreview.net/forum?id=g2YraF75Tj
Kod sumber terbuka: https://github.com / mr-eggplant/SAR

Apakah itu Penyesuaian Masa Ujian?

Teknologi pembelajaran mesin tradisional biasanya mempelajari sejumlah besar data latihan yang dikumpul terlebih dahulu, dan kemudian membetulkan model untuk ramalan inferens. Paradigma ini selalunya mencapai prestasi yang sangat baik apabila data ujian dan latihan datang daripada pengedaran data yang sama. Walau bagaimanapun, dalam aplikasi praktikal, pengedaran data ujian boleh dengan mudah menyimpang daripada pengedaran data latihan asal (anjakan pengedaran Contohnya, semasa mengumpul data ujian: 1) Perubahan cuaca menyebabkan imej mengandungi hujan, salji dan kabus oklusi; 2) Imej menjadi kabur kerana penangkapan yang tidak betul, atau imej mengandungi hingar akibat degradasi penderia; Situasi di atas adalah sangat biasa, tetapi ia selalunya membawa maut untuk model dalam, kerana prestasinya mungkin menurun dengan ketara dalam senario ini, dengan serius mengehadkan penggunaannya dalam dunia nyata (terutamanya aplikasi berisiko tinggi seperti pemanduan autonomi) penggunaan meluas.

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Rajah 1 Gambarajah Skema Penyesuaian Masa Ujian (rujuk [5]) dan hubungannya dengan moden Perbandingan ciri kaedah

berbeza daripada paradigma pembelajaran mesin tradisional, seperti yang ditunjukkan dalam Rajah 1. Selepas sampel ujian tiba, Masa Ujian Penyesuaian (TTA) pertama sekali berdasarkan Data digunakan untuk memperhalusi model dengan cara yang diselia sendiri atau tidak diselia, dan kemudian model yang dikemas kini digunakan untuk membuat ramalan akhir. Matlamat pembelajaran kendiri/tanpa seliaan biasa termasuk: ramalan putaran, pembelajaran kontrastif, pengecilan entropi, dsb. Kaedah ini semuanya menunjukkan prestasi generalisasi luar pengedaran yang sangat baik. Berbanding dengan kaedah Penalaan Halus dan Penyesuaian Domain Tanpa Pengawasan tradisional, Penyesuaian Masa Ujian boleh mencapai penghijrahan dalam talian, yang lebih cekap dan lebih universal. Selain itu, kaedah penyesuaian masa ujian yang lengkap [2] boleh disesuaikan dengan mana-mana model pra-latihan tanpa memerlukan data latihan asal atau gangguan terhadap proses latihan asal model tersebut. Kelebihan di atas telah banyak meningkatkan kepelbagaian praktikal kaedah TTA Ditambah dengan prestasi cemerlangnya, TTA telah menjadi hala tuju penyelidikan yang sangat panas dalam migrasi, generalisasi dan bidang lain yang berkaitan.

Mengapa Penyesuaian Masa Ujian Liar?

Walaupun kaedah TTA sedia ada telah menunjukkan potensi besar dalam generalisasi luar pengedaran, prestasi cemerlang ini selalunya diperoleh di bawah beberapa keadaan ujian tertentu, seperti Sampel aliran data dalam tempoh masa semuanya datang daripada jenis anjakan pengedaran yang sama, pengedaran kategori sebenar bagi sampel ujian adalah seragam dan rawak, dan setiap kali sampel kumpulan mini diperlukan sebelum penyesuaian boleh dilakukan. Tetapi sebenarnya, andaian-andaian yang berpotensi di atas ini sukar untuk sentiasa berpuas hati dalam dunia terbuka sebenar. Dalam amalan, strim data ujian mungkin tiba dalam sebarang kombinasi, dan idealnya model tidak boleh membuat sebarang andaian tentang bentuk strim data ujian yang tiba. Seperti yang ditunjukkan dalam Rajah 2, aliran data ujian mungkin ditemui: (a) sampel datang daripada offset pengedaran yang berbeza (iaitu, offset sampel campuran); (b) saiz kelompok sampel adalah sangat kecil ( Genap 1) ; (c) Taburan kategori sebenar sampel dalam tempoh masa adalah tidak sekata dan berubah secara dinamik . Artikel ini merujuk kepada TTA dalam senario di atas sebagai TTA Liar. Malangnya, kaedah TTA sedia ada sering kelihatan rapuh dan tidak stabil dalam senario liar ini, dengan prestasi penghijrahan terhad dan mungkin merosakkan prestasi model asal. Oleh itu, jika kita ingin benar-benar merealisasikan penggunaan aplikasi berskala besar dan mendalam bagi kaedah TTA dalam senario sebenar, menyelesaikan masalah TTA Liar adalah bahagian yang tidak dapat dielakkan dan penting.

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Rajah 2 Adegan terbuka dinamik semasa penyesuaian model semasa ujian model Idea penyelesaian dan penyelesaian teknikal

Artikel ini menganalisis sebab TTA gagal dalam banyak senario liar dari perspektif bersatu, dan kemudian menyediakan penyelesaian.

1. Mengapa TTA Liar tidak stabil?

(1) Penormalan Kelompok (BN) ialah salah satu sebab utama ketidakstabilan TTA dalam senario dinamik

: Kaedah TTA sedia ada biasanya diwujudkan Berdasarkan statistik BN adaptif, data ujian digunakan untuk mengira min dan sisihan piawai dalam lapisan BN. Walau bagaimanapun, dalam tiga senario dinamik sebenar, ketepatan anggaran statistik dalam lapisan BN akan menjadi berat sebelah, mengakibatkan TTA tidak stabil:

Senario (a) : Sejak statistik BN sebenarnya mewakili pengedaran data ujian tertentu, menggunakan set parameter statistik untuk menganggarkan berbilang pengedaran pada masa yang sama pasti akan membawa kepada prestasi terhad, lihat Rajah 3

Senario (b) : Statistik BN bergantung kepada saiz kelompok Sukar untuk mendapatkan anggaran statistik BN yang tepat pada sampel saiz kelompok kecil, lihat Rajah 4; pengedaran label yang tidak seimbang akan membawa kepada berat sebelah dalam statistik dalam lapisan BN, iaitu, statistik adalah berat sebelah kepada kategori tertentu (kategori dengan bahagian yang lebih besar dalam kumpulan), lihat Rajah 5; >
Untuk mengesahkan lagi analisis di atas, artikel ini mempertimbangkan 3 model yang digunakan secara meluas (dilengkapi dengan Norma BatchLayerGroup berbeza), berdasarkan dua kaedah TTA yang mewakili (TTT [1] dan Khemah [2]) Pengesahan analisis. Kesimpulan akhir ialah: Lapisan Norm bebas kelompok (Norma Kumpulan dan Lapisan) memintas batasan Batch Norm pada tahap tertentu, dan lebih sesuai untuk melaksanakan TTA dalam senario terbuka dinamik, dan kestabilannya juga lebih tinggi. Oleh itu, artikel ini juga akan mereka bentuk kaedah berdasarkan model yang dilengkapi dengan GroupLayer Norm.

Rajah 3 Kaedah dan model yang berbeza (lapisan normalisasi yang berbeza) dalam bias taburan campuran Move menurunkan prestasi

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Rajah 4 Kaedah dan model yang berbeza ( Berbeza lapisan normalisasi) prestasi di bawah saiz kelompok yang berbeza. Kawasan berlorek dalam rajah mewakili sisihan piawai prestasi model Sisihan piawai ResNet50-BN dan ResNet50-GN adalah terlalu kecil dan tidak ketara dalam rajah (sama seperti rajah di bawah)

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Rajah 5 Prestasi kaedah dan model yang berbeza (lapisan normalisasi yang berbeza) di bawah anjakan pengedaran label tidak seimbang dalam talian Prestasi, semakin besar Nisbah Ketidakseimbangan pada paksi mendatar dalam rajah, lebih serius ketidakseimbangan label kepada penyelesaian remeh yang merosot, iaitu, meramalkan mana-mana sampel kepada kelas yang sama : Menurut Rajah 6 (a) dan (b) , apabila peralihan pengedaran adalah serius (tahap 5), proses penyesuaian dalam talian tiba-tiba muncul Fenomena kemerosotan dan keruntuhan Model, iaitu, semua sampel (dengan kategori sebenar yang berbeza) diramalkan ke kelas yang sama, norma; kecerunan model meningkat dengan cepat sebelum dan selepas model runtuh dan kemudian menurun kepada hampir 0, lihat Rajah 6 (c), penjelasan sampingan mungkin Ia adalah beberapa kecerunan berskala besar/bunyi yang memusnahkan parameter model, menyebabkan model runtuh.

Rajah 6 Analisis kes kegagalan dalam pengurangan entropi semasa ujian dalam talian

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

2. Kaedah pengecilan entropi masa ujian yang sensitif ketajaman

Untuk mengurangkan masalah degradasi model di atas, kertas kerja ini mencadangkan Kaedah Pengurangan Entropi (SAR) yang Sedar Ketajaman dan Boleh Dipercayai semasa ujian. Ia mengurangkan masalah ini dalam dua cara: 1) Pengecilan entropi yang boleh dipercayai mengeluarkan beberapa sampel yang menghasilkan kecerunan besar/bising daripada kemas kini penyesuaian model; 2)

Pengoptimuman ketajaman model

menjadikan model tidak sensitif kepada kecerunan hingar tertentu yang dijana dalam sampel yang tinggal. Butiran khusus dijelaskan seperti berikut: Pengurangan entropi yang boleh dipercayai: Berdasarkan Entropi, indeks pertimbangan alternatif untuk pemilihan kecerunan diwujudkan, dan sampel entropi tinggi ( termasuk dalam Rajah 6 (d) Sampel dari kawasan 1 dan 2) dikecualikan daripada penyesuaian model dan tidak mengambil bahagian dalam kemas kini model:

di mana x mewakili sampel ujian, Θ mewakili parameter model,

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

mewakili fungsi penunjuk,

mewakili entropi sampel hasil ramalan, Batch Norm层等暴露TTA短板，开放环境下解决方案来了 ialah parameter super. Hanya jika sampel akan mengambil bahagian dalam pengiraan rambatan belakang.

Pengoptimuman entropi sensitif ketajaman: Sampel yang ditapis oleh mekanisme pemilihan sampel yang boleh dipercayai tidak boleh mengelakkan masih mengandungi Rajah 6 (d) sampel Rantau 4, sampel ini boleh menghasilkan bunyi/kecerunan besar yang terus mengganggu model. Untuk tujuan ini, artikel ini mempertimbangkan untuk mengoptimumkan model kepada minimum rata supaya ia tidak sensitif terhadap kemas kini model yang disebabkan oleh kecerunan hingar, iaitu, ia tidak akan menjejaskan prestasi model asalnya. Matlamat pengoptimuman ialah:

Borang kemas kini kecerunan akhir sasaran di atas adalah seperti berikut:

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

di mana Batch Norm层等暴露TTA短板，开放环境下解决方案来了 diilhamkan oleh SAM [4] dan diperolehi dengan penyelesaian anggaran pengembangan Taylor tertib pertama Untuk butiran, sila rujuk kepada teks dan kod asal kertas ini.

Pada ketika ini, matlamat pengoptimuman keseluruhan artikel ini ialah:

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Selain itu, untuk mengelakkan kemungkinan skim di atas masih gagal dalam keadaan yang melampau, strategi pemulihan model diperkenalkan selanjutnya: melalui pemantauan mudah alih sama ada model itu telah merosot atau runtuh, diputuskan untuk memulihkan nilai asal parameter kemas kini model pada masa yang diperlukan.

Penilaian eksperimen

Perbandingan prestasi dalam senario terbuka dinamik

SAR berdasarkan tiga di atas Senario terbuka dinamik, iaitu a) anjakan pengedaran bercampur, b) penyesuaian sampel tunggal dan c) anjakan pengedaran kelas tidak seimbang dalam talian, telah disahkan secara eksperimen pada set data ImageNet-C, dan hasilnya ditunjukkan dalam Jadual 1, 2, dan 3 . SAR mencapai hasil yang luar biasa dalam ketiga-tiga senario, terutamanya dalam senario b) dan c). SAR menggunakan VitBase sebagai model asas, dan ketepatannya melebihi kaedah SOTA semasa EATA sebanyak hampir 10%.

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Jadual 1 SAR bercampur dengan kaedah sedia ada untuk 15 jenis kerosakan dalam perbandingan Prestasi ImageNet-C dalam senario, sepadan dengan senario dinamik (a); dan perbandingan kecekapan dengan kaedah sedia ada

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Jadual 2 Perbandingan prestasi antara SAR dan kaedah sedia ada dalam senario penyesuaian sampel tunggal pada ImageNet-C, sepadan dengan senario dinamik (b)

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Jadual 3 Perbandingan prestasi antara SAR dan kaedah sedia ada dalam senario peralihan pengedaran kelas tidak seimbang dalam talian pada ImageNet-C, adegan Dinamik yang sepadan (c)

Eksperimen Ablasi

dan kaedah keratan kecerunan Perbandingan : Keratan kecerunan ialah kaedah mudah dan langsung untuk mengelakkan kecerunan besar daripada menjejaskan kemas kini model (atau malah menyebabkan keruntuhan). Berikut ialah perbandingan dengan dua varian keratan kecerunan (iaitu: mengikut nilai atau mengikut norma). Seperti yang ditunjukkan dalam rajah di bawah, keratan kecerunan sangat sensitif terhadap pemilihan ambang keratan kecerunan δ δ yang lebih kecil adalah bersamaan dengan hasil model yang tidak dikemas kini, dan δ yang lebih besar sukar untuk mengelakkan keruntuhan model. Sebaliknya, SAR tidak memerlukan proses penapisan hiperparameter yang rumit dan menunjukkan prestasi yang lebih baik daripada pemotongan kecerunan.

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Rajah 7 dengan kaedah keratan kecerunan dalam ImageNet-C (shot nose, tahap 5 ) pada senario peralihan pengedaran label tidak seimbang dalam talian. Ketepatan dikira dalam talian berdasarkan semua sampel ujian sebelumnya

Kesan modul berbeza pada prestasi algoritma: seperti yang ditunjukkan dalam jadual di bawah , sinergi modul berbeza SAR secara berkesan meningkatkan kestabilan penyesuaian model semasa ujian dalam senario terbuka dinamik.

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Jadual 4 SAR dalam talian pengedaran label tidak seimbang pada ImageNet-C (tahap 5) Percubaan Ablasi dalam senario offset

Visualisasi ketajaman permukaan Loss: Hasil visualisasi fungsi kehilangan dengan menambah gangguan pada berat model ditunjukkan dalam rajah di bawah. Antaranya, SAR mempunyai kawasan yang lebih besar (kawasan biru tua) dalam kontur kehilangan terendah daripada Khemah, menunjukkan bahawa penyelesaian yang diperolehi oleh SAR adalah lebih rata, lebih teguh kepada bunyi/kecerunan yang lebih besar, dan mempunyai keupayaan anti-gangguan yang lebih kuat.

Batch Norm层等暴露TTA短板，开放环境下解决方案来了

Rajah 8 Penggambaran permukaan kehilangan entropi

Kesimpulan

Artikel ini dikhaskan untuk menyelesaikan masalah ketidakstabilan penyesuaian semasa ujian dalam talian model dalam senario terbuka dinamik. Untuk tujuan ini, artikel ini terlebih dahulu menganalisis sebab kaedah sedia ada gagal dalam senario dinamik sebenar dari perspektif bersatu dan mereka bentuk percubaan lengkap untuk menjalankan pengesahan yang mendalam. Berdasarkan analisis ini, kertas ini akhirnya mencadangkan kaedah pengecilan entropi masa ujian yang sensitif ketajaman dan boleh dipercayai, yang mencapai penyesuaian masa ujian dalam talian model yang stabil dan cekap dengan menyekat kesan sampel ujian tertentu dengan kecerunan/bunyi besar pada kemas kini model. .

Atas ialah kandungan terperinci Penyelesaian persekitaran terbuka yang menyelesaikan kekurangan seperti lapisan Batch Norm. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7517

Tutorial CakePHP

1378

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Empat alat pengaturcaraan berbantukan AI yang disyorkan Apr 22, 2024 pm 05:34 PM

Alat pengaturcaraan berbantukan AI ini telah menemui sejumlah besar alat pengaturcaraan berbantukan AI yang berguna dalam peringkat pembangunan AI yang pesat ini. Alat pengaturcaraan berbantukan AI boleh meningkatkan kecekapan pembangunan, meningkatkan kualiti kod dan mengurangkan kadar pepijat Ia adalah pembantu penting dalam proses pembangunan perisian moden. Hari ini Dayao akan berkongsi dengan anda 4 alat pengaturcaraan berbantukan AI (dan semua menyokong bahasa C# saya harap ia akan membantu semua orang). https://github.com/YSGStudyHards/DotNetGuide1.GitHubCopilotGitHubCopilot ialah pembantu pengekodan AI yang membantu anda menulis kod dengan lebih pantas dan dengan sedikit usaha, supaya anda boleh lebih memfokuskan pada penyelesaian masalah dan kerjasama. Git

Kertas Stable Diffusion 3 akhirnya telah dikeluarkan, dan butiran seni bina didedahkan Adakah ia akan membantu untuk menghasilkan semula Sora? Mar 06, 2024 pm 05:34 PM

Kertas StableDiffusion3 akhirnya di sini! Model ini dikeluarkan dua minggu lalu dan menggunakan seni bina DiT (DiffusionTransformer) yang sama seperti Sora. Ia menimbulkan kekecohan apabila ia dikeluarkan. Berbanding dengan versi sebelumnya, kualiti imej yang dijana oleh StableDiffusion3 telah dipertingkatkan dengan ketara Ia kini menyokong gesaan berbilang tema, dan kesan penulisan teks juga telah dipertingkatkan, dan aksara bercelaru tidak lagi muncul. StabilityAI menegaskan bahawa StableDiffusion3 ialah satu siri model dengan saiz parameter antara 800M hingga 8B. Julat parameter ini bermakna model boleh dijalankan terus pada banyak peranti mudah alih, dengan ketara mengurangkan penggunaan AI

DualBEV: mengatasi BEVFormer dan BEVDet4D dengan ketara, buka buku! Mar 21, 2024 pm 05:21 PM

Kertas kerja ini meneroka masalah mengesan objek dengan tepat dari sudut pandangan yang berbeza (seperti perspektif dan pandangan mata burung) dalam pemanduan autonomi, terutamanya cara mengubah ciri dari perspektif (PV) kepada ruang pandangan mata burung (BEV) dengan berkesan dilaksanakan melalui modul Transformasi Visual (VT). Kaedah sedia ada secara amnya dibahagikan kepada dua strategi: penukaran 2D kepada 3D dan 3D kepada 2D. Kaedah 2D-ke-3D meningkatkan ciri 2D yang padat dengan meramalkan kebarangkalian kedalaman, tetapi ketidakpastian yang wujud dalam ramalan kedalaman, terutamanya di kawasan yang jauh, mungkin menimbulkan ketidaktepatan. Manakala kaedah 3D ke 2D biasanya menggunakan pertanyaan 3D untuk mencuba ciri 2D dan mempelajari berat perhatian bagi kesesuaian antara ciri 3D dan 2D melalui Transformer, yang meningkatkan masa pengiraan dan penggunaan.

Pengaturcara AI manakah yang terbaik? Terokai potensi Devin, Tongyi Lingma dan ejen SWE Apr 07, 2024 am 09:10 AM

Pada 3 Mac 2022, kurang daripada sebulan selepas kelahiran pengaturcara AI pertama di dunia, Devin, pasukan NLP Universiti Princeton membangunkan pengaturcara AI sumber terbuka ejen SWE. Ia memanfaatkan model GPT-4 untuk menyelesaikan isu secara automatik dalam repositori GitHub. Prestasi ejen SWE pada set ujian bangku SWE adalah serupa dengan Devin, mengambil purata 93 saat dan menyelesaikan 12.29% masalah. Dengan berinteraksi dengan terminal khusus, ejen SWE boleh membuka dan mencari kandungan fail, menggunakan semakan sintaks automatik, mengedit baris tertentu dan menulis serta melaksanakan ujian. (Nota: Kandungan di atas adalah sedikit pelarasan bagi kandungan asal, tetapi maklumat utama dalam teks asal dikekalkan dan tidak melebihi had perkataan yang ditentukan.) SWE-A

Ketahui cara membangunkan aplikasi mudah alih menggunakan bahasa Go Mar 28, 2024 pm 10:00 PM

Tutorial aplikasi mudah alih pembangunan bahasa Go Memandangkan pasaran aplikasi mudah alih terus berkembang pesat, semakin ramai pembangun mula meneroka cara menggunakan bahasa Go untuk membangunkan aplikasi mudah alih. Sebagai bahasa pengaturcaraan yang mudah dan cekap, bahasa Go juga telah menunjukkan potensi yang kukuh dalam pembangunan aplikasi mudah alih. Artikel ini akan memperkenalkan secara terperinci cara menggunakan bahasa Go untuk membangunkan aplikasi mudah alih dan melampirkan contoh kod khusus untuk membantu pembaca bermula dengan cepat dan mula membangunkan aplikasi mudah alih mereka sendiri. 1. Persediaan Sebelum memulakan, kita perlu menyediakan persekitaran dan alatan pembangunan. kepala

Pengedaran Linux manakah yang terbaik untuk pembangunan Android? Mar 14, 2024 pm 12:30 PM

Pembangunan Android ialah kerja yang sibuk dan menarik, dan amat penting untuk memilih pengedaran Linux yang sesuai untuk pembangunan. Di antara banyak pengedaran Linux, yang manakah paling sesuai untuk pembangunan Android? Artikel ini akan meneroka isu ini dari beberapa aspek dan memberikan contoh kod khusus. Mula-mula, mari kita lihat beberapa pengedaran Linux yang popular pada masa ini: Ubuntu, Fedora, Debian, CentOS, dll. Mereka semua mempunyai kelebihan dan ciri tersendiri.

Memahami VSCode: Untuk apa alat ini digunakan? Mar 25, 2024 pm 03:06 PM

"Memahami VSCode: Untuk apa alat ini digunakan?" 》Sebagai pengaturcara, sama ada anda seorang pemula atau pembangun berpengalaman, anda tidak boleh melakukannya tanpa menggunakan alat penyuntingan kod. Di antara banyak alat penyuntingan, Kod Visual Studio (pendek kata VSCode) sangat popular di kalangan pembangun sebagai penyunting kod sumber terbuka, ringan dan berkuasa. Jadi, untuk apa sebenarnya VSCode digunakan? Artikel ini akan menyelidiki fungsi dan kegunaan VSCode dan menyediakan contoh kod khusus untuk membantu pembaca

Semakan! Gabungan model mendalam (LLM/model asas/pembelajaran bersekutu/penalaan halus, dsb.) Apr 18, 2024 pm 09:43 PM

Pada 23 September, kertas kerja "DeepModelFusion:ASurvey" diterbitkan oleh Universiti Teknologi Pertahanan Nasional, JD.com dan Institut Teknologi Beijing. Gabungan/penggabungan model dalam ialah teknologi baru muncul yang menggabungkan parameter atau ramalan berbilang model pembelajaran mendalam ke dalam satu model. Ia menggabungkan keupayaan model yang berbeza untuk mengimbangi bias dan ralat model individu untuk prestasi yang lebih baik. Gabungan model mendalam pada model pembelajaran mendalam berskala besar (seperti LLM dan model asas) menghadapi beberapa cabaran, termasuk kos pengiraan yang tinggi, ruang parameter berdimensi tinggi, gangguan antara model heterogen yang berbeza, dsb. Artikel ini membahagikan kaedah gabungan model dalam sedia ada kepada empat kategori: (1) "Sambungan corak", yang menghubungkan penyelesaian dalam ruang berat melalui laluan pengurangan kerugian untuk mendapatkan gabungan model awal yang lebih baik.

See all articles