Rumah Peranti teknologi AI Sky-T1: $ 450 LLM Mencabar GPT-4O & DeepSeek v3

Sky-T1: $ 450 LLM Mencabar GPT-4O & DeepSeek v3

Mar 10, 2025 am 10:20 AM

Pasukan Novasky UC Berkeley telah mencapai prestasi terobosan di dunia AI, melancarkan Sky-T1-32B-Preview-model penalaran sumber yang sangat berpatutan dan penuh. Model ini menyaingi prestasi model komersil terkemuka seperti GPT-4 dan O1, namun kos latihannya berada di bawah $ 450. Ini secara dramatik mengurangkan belanjawan berjuta-juta dolar yang biasanya dikaitkan dengan pembangunan AI yang maju.

Kebolehcapaian Sky-T1-32B-Preview adalah aspek yang paling penting. Seluruh projek -data, kod, dan berat model -tersedia secara terbuka, memberi kuasa kepada penyelidik, ahli akademik, dan peminat untuk menyumbang kepada peningkatannya dan seterusnya pendemokrasian AI.

Apa yang menetapkan Sky-T1-32B-Preview selain?

Tidak seperti banyak model berprestasi tinggi yang kerja dalamannya tetap proprietari, Sky-T1-32B-Preview menawarkan ketelusan lengkap. Prestasi yang luar biasa dalam kedua -dua penalaran matematik dan tugas pengekodan sangat penting.

Penciptaan Sky-T1-32B-Preview:

Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3 Proses pembangunan melibatkan beberapa langkah utama:

  1. Curation data yang ketat:

    pelbagai dataset yang merangkumi matematik, pengekodan, sains, dan teka -teki dengan teliti dikumpulkan dan ditapis menggunakan teknik seperti pensampelan penolakan untuk memastikan kualiti data. Data memformat semula ketepatan yang dipertingkatkan lagi.

  2. Latihan yang cekap:

    Pasukan ini menyempurnakan model QWEN-2.5-32B sumber terbuka menggunakan dataset yang disediakan. Proses latihan, yang disiapkan hanya dalam 19 jam pada lapan GPU mewah, menyoroti kecekapan pendekatan mereka.

  3. Data Latihan Balanced:

    Faktor kejayaan utama adalah keseimbangan yang teliti antara masalah matematik dan pengekodan dalam data latihan, membolehkan model untuk unggul di kedua -dua kawasan.

Hasil penanda aras:

prestasi Sky-T1-32B-Preview adalah luar biasa di pelbagai tanda aras:

    Matematik:
  • mencapai ketepatan 82.4% pada Math500 dan 43.3% pada AIME2024, kompetitif dengan model komersil teratas. pengekodan:
  • menjaringkan 86.3% pada LiveCodeBench-Easy, menunjukkan kemahiran dalam tugas pengekodan kompleks.

Penemuan Utama: Sky-T1: The 0 LLM Challenging GPT-4o & DeepSeek V3

Kepelbagaian data adalah kunci:

Campuran data matematik dan pengekodan seimbang sangat penting untuk kejayaan model.
  • Saiz model optimum: Eksperimen menunjukkan bahawa model parameter 32B adalah saiz optimum untuk mencapai keupayaan penalaran maju.
  • Masa Depan Penalaran Sumber Terbuka:

Sky-T1-32B-Preview mewakili langkah penting ke hadapan, dan Novasky merancang untuk meneruskan kecekapan dan ketepatan model penapisan. Komitmen mereka untuk pembangunan sumber terbuka memupuk kerjasama dan mempercepatkan kemajuan dalam bidang.

Sumber:

  • [pautan ke kod]
  • [Laporan Teknikal]
  • [berat model]

Kesimpulan:

Pencapaian Novasky mencabar paradigma yang ditubuhkan dari pembangunan AI yang mahal dan tertutup. Dengan menunjukkan bahawa model berprestasi tinggi boleh diwujudkan dengan mudah dan terbuka, mereka mendemokrasikan akses kepada teknologi AI canggih dan memupuk persekitaran penyelidikan yang lebih inklusif dan kolaboratif.

Atas ialah kandungan terperinci Sky-T1: $ 450 LLM Mencabar GPT-4O & DeepSeek v3. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Penjana Seni AI Terbaik (Percuma & amp; Dibayar) untuk projek kreatif Penjana Seni AI Terbaik (Percuma & amp; Dibayar) untuk projek kreatif Apr 02, 2025 pm 06:10 PM

Artikel ini mengkaji semula penjana seni AI atas, membincangkan ciri -ciri mereka, kesesuaian untuk projek kreatif, dan nilai. Ia menyerlahkan Midjourney sebagai nilai terbaik untuk profesional dan mengesyorkan Dall-E 2 untuk seni berkualiti tinggi dan disesuaikan.

Bermula dengan Meta Llama 3.2 - Analytics Vidhya Bermula dengan Meta Llama 3.2 - Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta's Llama 3.2: Lompat ke hadapan dalam Multimodal dan Mobile AI META baru -baru ini melancarkan Llama 3.2, kemajuan yang ketara dalam AI yang memaparkan keupayaan penglihatan yang kuat dan model teks ringan yang dioptimumkan untuk peranti mudah alih. Membina kejayaan o

CHATBOTS AI terbaik berbanding (Chatgpt, Gemini, Claude & amp; Lagi) CHATBOTS AI terbaik berbanding (Chatgpt, Gemini, Claude & amp; Lagi) Apr 02, 2025 pm 06:09 PM

Artikel ini membandingkan chatbots AI seperti Chatgpt, Gemini, dan Claude, yang memberi tumpuan kepada ciri -ciri unik mereka, pilihan penyesuaian, dan prestasi dalam pemprosesan bahasa semula jadi dan kebolehpercayaan.

Pembantu Menulis AI Teratas untuk Meningkatkan Penciptaan Kandungan Anda Pembantu Menulis AI Teratas untuk Meningkatkan Penciptaan Kandungan Anda Apr 02, 2025 pm 06:11 PM

Artikel ini membincangkan pembantu penulisan AI terkemuka seperti Grammarly, Jasper, Copy.ai, WriteSonic, dan Rytr, yang memberi tumpuan kepada ciri -ciri unik mereka untuk penciptaan kandungan. Ia berpendapat bahawa Jasper cemerlang dalam pengoptimuman SEO, sementara alat AI membantu mengekalkan nada terdiri

AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi Apr 11, 2025 pm 12:01 PM

Landskap AI minggu ini: Badai kemajuan, pertimbangan etika, dan perdebatan pengawalseliaan. Pemain utama seperti Openai, Google, Meta, dan Microsoft telah melepaskan kemas kini, dari model baru yang terobosan ke peralihan penting di LE

Menjual Strategi AI kepada Pekerja: Manifesto CEO Shopify Menjual Strategi AI kepada Pekerja: Manifesto CEO Shopify Apr 10, 2025 am 11:19 AM

Memo CEO Shopify Tobi Lütke baru -baru ini dengan berani mengisytiharkan penguasaan AI sebagai harapan asas bagi setiap pekerja, menandakan peralihan budaya yang signifikan dalam syarikat. Ini bukan trend seketika; Ini adalah paradigma operasi baru yang disatukan ke p

Sistem Rag Agentik 7 Teratas untuk Membina Ejen AI Sistem Rag Agentik 7 Teratas untuk Membina Ejen AI Mar 31, 2025 pm 04:25 PM

2024 menyaksikan peralihan daripada menggunakan LLMS untuk penjanaan kandungan untuk memahami kerja dalaman mereka. Eksplorasi ini membawa kepada penemuan agen AI - sistem pengendalian sistem autonomi dan keputusan dengan intervensi manusia yang minimum. Buildin

10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari 10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari Apr 13, 2025 am 01:14 AM

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let &#8217

See all articles