Rumah Peranti teknologi AI Ujian dalaman Kimi Chat bermula, Volcano Engine menyediakan penyelesaian pecutan, menyokong latihan dan inferens perkhidmatan model besar AI Moonshot

Ujian dalaman Kimi Chat bermula, Volcano Engine menyediakan penyelesaian pecutan, menyokong latihan dan inferens perkhidmatan model besar AI Moonshot

Oct 11, 2023 pm 01:45 PM

Pada 9 Oktober, Beijing Dark Side of the Moon Technology Co., Ltd. (Moonshot AI) mengumumkan satu kejayaan dalam bidang "teks panjang" dan melancarkan Kimi Chat, produk pembantu pintar pertama yang menyokong input sebanyak 200,000 aksara Cina. Ini ialah panjang input konteks terpanjang yang boleh disokong oleh perkhidmatan model besar yang boleh digunakan secara komersil di pasaran global, menandakan tahap terkemuka dunia Moonshot AI dalam teknologi penting ini.

The Volcano Engine mempunyai kerjasama yang mendalam dengan Moonshot AI untuk menyediakannya secara eksklusif dengan penyelesaian latihan AI dan pecutan inferens yang sangat stabil dan kos efektif Kedua-dua pihak bersama-sama menjalankan penyelidikan dan pembangunan teknologi untuk bersama-sama mempromosikan aplikasi model bahasa besar dalam menegak bidang dan senario umum. Pada masa yang sama, Kimi Chat tidak lama lagi akan menyertai platform perkhidmatan model besar Volcano Engine - Volcano Ark. Kedua-dua pihak akan terus menyediakan perusahaan dan pengguna dengan aplikasi AI yang lebih kaya dalam bidang ekologi model besar.

Berbanding dengan perkhidmatan model besar semasa di pasaran yang dilatih berdasarkan bahasa Inggeris, Kimi Chat mempunyai keupayaan berbilang bahasa yang kukuh Contohnya, Kimi Chat mempunyai kelebihan yang ketara dalam bahasa Cina, dan kesan penggunaan sebenar boleh menyokong konteks kira-kira 200,000. Aksara Cina. 2.5 kali ganda daripada Anthropic's Claude-100k (sebenarnya diukur kira-kira 80,000 perkataan), dan 8 kali ganda daripada OpenAI's GPT-4-32k (sebenarnya diukur kira-kira 25,000 perkataan). Pada masa yang sama, Kimi Chat boleh mencapai mekanisme perhatian jarak jauh tanpa kerugian di bawah ratusan bilion parameter melalui struktur rangkaian yang inovatif dan pengoptimuman kejuruteraan, dan tidak bergantung pada penyelesaian "pintasan" seperti tingkap gelongsor, pensampelan bawah dan model kecil yang boleh merosakkan prestasi.

Dalam temu bual sebelum ini, Yang Zhilin, pengasas Moonshot AI, pernah berkata bahawa pemampatan tanpa kehilangan data besar-besaran boleh mencapai tahap kecerdasan yang tinggi, sama ada teks, suara atau video. Had atas keupayaan model yang besar (iaitu, nisbah mampatan tanpa kehilangan) ditentukan oleh kedua-dua keupayaan satu langkah dan bilangan langkah yang dilaksanakan Yang pertama adalah berkaitan dengan bilangan parameter, dan yang terakhir merujuk kepada panjang konteks

Menghadapi cabaran untuk melaksanakan model bahasa yang besar dan mempromosikan pelaksanaan aplikasi industri

Moonshot AI percaya bahawa meningkatkan panjang konteks boleh membawa peluang pembangunan baharu kepada aplikasi model berskala besar, membolehkannya memasuki era LLM Panjang (LLLM) dari era LLM, dan mencapai penyesuaian yang tepat kepada pelbagai industri. Apabila meneroka kaedah yang berkesan untuk memproses adegan teks panjang, aplikasi model berskala besar perlu terus meneroka cara baharu untuk menyelesaikan masalah ilusi model dan meningkatkan kebolehkawalan kandungan yang dijana, sambil mencari laluan baharu untuk pembangunan keupayaan model skala besar yang diperibadikan. . Dalam proses pembangunan model bahasa berskala besar, adalah perlu untuk mengatasi pelbagai ambang seperti pengembangan keperluan sumber pengkomputeran, ketidakstabilan kejuruteraan tugas, kos projek yang tinggi, keselamatan dan kepercayaan, dll., untuk meningkatkan kecekapan latihan model

Untuk menyelesaikan masalah di atas, Moonshot AI telah bergabung dengan Volcano Engine untuk menginovasi teknologi AI dan menjalankan amalan AGI pada platform pembelajaran mesin Volcano Engine veMLP. Moonshot AI menggunakan sepenuhnya kumpulan sumber GPU dan berdasarkan model pra-latihan berskala besar untuk mencapai latihan biasa dan stabil pada skala ribuan kalori setiap hari, dalam tempoh enam bulan, ia melatih model bahasa besar Kimi Chat skala ratusan bilion parameter, membuka kunci penulisan adegan profesional dan teks ultra-panjang Ia boleh memahami senario yang kompleks seperti analisis, dialog diperibadikan dengan memori ultra-panjang, dan Soal Jawab pengetahuan berdasarkan sejumlah besar dokumen, dan telah berjaya. digunakan dalam banyak syarikat terkenal.

Pengasas bersama Moonshot AI Zhou Xinyu berkata: "Moonshot AI menumpukan pada penerokaan sempadan kecerdasan buatan umum dan komited untuk mengubah kuasa pengkomputeran kepada penyelesaian optimum pintar. Volcano Engine mempunyai keupayaan infrastruktur terkemuka domestik dan rizab kuasa pengkomputeran. Pada masa hadapan, kedua-dua pihak Kami akan terus bekerjasama dalam bidang seperti infrastruktur pengkomputeran AI dan pengembangan senario aplikasi untuk bersama-sama mempromosikan pembangunan teknologi kecerdasan buatan dan menyediakan pengguna pengalaman perkhidmatan yang stabil, cekap dan pintar.”

Dengan menggunakan platform pembelajaran mesin Volcano Engine, latihan model besar boleh menjadi lebih stabil dan lebih pantas

Enjin Volcano menyediakan penyelesaian latihan AI dan pecutan inferens yang sangat stabil dan kos efektif untuk pembinaan dan latihan model besar veMLP platform pembelajaran mesinnya telah digilap untuk masa yang lama oleh perniagaan pengguna besar-besaran seperti Douyin, dan telah membentuk satu. pengoptimuman kejuruteraan pembangunan AI timbunan penuh dan amalan terbaik seperti penyelesaian, pemulihan kesalahan tugas dan kebolehmerhatian eksperimen menyediakan perkhidmatan pembangunan dan lelaran AI sehenti yang cekap, stabil, selamat dan saling dipercayai, menjadikan latihan model besar lebih pantas. , lebih stabil dan lebih menjimatkan kos. Moonshot AI adalah berdasarkan penyelesaian latihan AI berskala ultra besar dan pecutan inferens yang disediakan oleh Enjin Gunung Berapi, membantu pasukan mencapai lelaran latihan berterusan, penalaan halus dan inferens model bahasa besar dengan cepat, stabil dan pada kos yang rendah.

1. Penjadualan berskala kuasa pengkomputeran IaaS dan sumber storan

Membina kluster pengkomputeran berprestasi tinggi untuk mencapai latihan model besar tahap 10,000, rangkaian kelewatan tahap mikrosaat dan pengkomputeran anjal boleh menjimatkan 70% kos kuasa pengkomputeran menggunakan penyelesaian pecutan berperingkat panas dan sejuk vePFS untuk memenuhi pemprosesan data latihan yang tinggi sambil memastikan kos penyimpanan keseluruhan dikurangkan sebanyak 65%. Untuk corak membaca dan menulis sistem fail model besar, kami bersama-sama membangunkan sistem caching fail khusus untuk meningkatkan penggunaan kad grafik dengan lebih baik.

2. Memastikan kestabilan kelompok pengkomputeran PaaS

Optimumkan kestabilan kluster latihan yang sangat besar, sediakan pengoptimuman pemulihan kerosakan perkakasan dan keupayaan diagnosis bebas, benarkan tugas pengguna untuk mencuba semula dengan pantas dan menyambung semula latihan, mencapai latihan stabil peringkat bulanan dan mengurangkan RingAllReduce melalui pengoptimuman pertalian komunikasi berbilang mesin tugas latihan Berkomunikasi merentasi suis.

3. Eksperimen dengan kebolehmerhatian yang tinggi

Percubaan pengurusan untuk pelbagai tugas latihan, dan bandingkan hasil latihan melalui visualisasi untuk menentukan model yang akan dilancarkan secara berulang menggunakan log pemantauan yang lengkap untuk membantu perniagaan menala parameter selari 3D dan membantu dalam mengesan kesilapan latihan

Keselamatan dan penyelesaian saling percaya untuk perkhidmatan model besar

Menggabungkan pengkomputeran privasi yang dipercayai dengan aplikasi LLM untuk menyediakan fungsi kotak pasir keselamatan dan meningkatkan kawalan kebenaran pembangun. Enjin Volcano juga berfungsi dengan Moonshot AI untuk mereka bentuk aliran kerja yang sesuai untuk tabiat pembangunan model yang besar, memastikan akses hierarki kepada data dan memastikan keselamatan data sambil memastikan kecekapan kerja.

Wu Di, ketua algoritma pintar Volcano Engine, berkata: "Volcano Engine sentiasa berpegang kepada sikap kerjasama yang memfokuskan pada teknologi, memperkasakan rakan kongsi dan simbiosis nilai. Moonshot AI mempunyai pasukan R&D model besar yang paling maju dalam China dan mempunyai pemahaman yang mendalam dan pengalaman aplikasi teknologi AI , kerjasama antara kedua-dua pihak akan terus menyediakan aplikasi AI yang lebih kaya kepada perusahaan dan pengguna dalam bidang perkhidmatan ekologi berbilang model.”

.

Kimi Chat内测启动,火山引擎提供加速解决方案,支持Moonshot AI大模型服务的训练和推理

Pandangan panorama Ark Volcano

Pada masa ini, Volcano Ark telah menarik model besar daripada banyak syarikat teknologi AI dan institut penyelidikan seperti Zhipu AI, Minimax dan ByteDance Skylark. Perkhidmatan model besar Moonshot AI Kimi Chat juga akan datang ke Volcano Ark. Volcano Engine akan bekerjasama dengan pembekal perkhidmatan model besar domestik yang cemerlang untuk menyediakan rangkaian penuh fungsi dan perkhidmatan seperti latihan model, inferens, penilaian dan penalaan halus untuk membantu semua lapisan masyarakat mempercepatkan pembangunan AI. Semua syarikat dialu-alukan untuk mengalami model besar di Volcano Ark. Volcano Ark bersedia untuk berkembang bersama-sama dengan semua orang!

Atas ialah kandungan terperinci Ujian dalaman Kimi Chat bermula, Volcano Engine menyediakan penyelesaian pecutan, menyokong latihan dan inferens perkhidmatan model besar AI Moonshot. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Saya cuba pengekodan getaran dengan kursor AI dan ia menakjubkan! Saya cuba pengekodan getaran dengan kursor AI dan ia menakjubkan! Mar 20, 2025 pm 03:34 PM

Pengekodan Vibe membentuk semula dunia pembangunan perisian dengan membiarkan kami membuat aplikasi menggunakan bahasa semulajadi dan bukannya kod yang tidak berkesudahan. Diilhamkan oleh penglihatan seperti Andrej Karpathy, pendekatan inovatif ini membolehkan Dev

Top 5 Genai dilancarkan pada Februari 2025: GPT-4.5, Grok-3 & More! Top 5 Genai dilancarkan pada Februari 2025: GPT-4.5, Grok-3 & More! Mar 22, 2025 am 10:58 AM

Februari 2025 telah menjadi satu lagi bulan yang berubah-ubah untuk AI generatif, membawa kita beberapa peningkatan model yang paling dinanti-nantikan dan ciri-ciri baru yang hebat. Dari Xai's Grok 3 dan Anthropic's Claude 3.7 Sonnet, ke Openai's G

Bagaimana cara menggunakan Yolo V12 untuk pengesanan objek? Bagaimana cara menggunakan Yolo V12 untuk pengesanan objek? Mar 22, 2025 am 11:07 AM

Yolo (anda hanya melihat sekali) telah menjadi kerangka pengesanan objek masa nyata yang terkemuka, dengan setiap lelaran bertambah baik pada versi sebelumnya. Versi terbaru Yolo V12 memperkenalkan kemajuan yang meningkatkan ketepatan

Adakah chatgpt 4 o tersedia? Adakah chatgpt 4 o tersedia? Mar 28, 2025 pm 05:29 PM

CHATGPT 4 kini tersedia dan digunakan secara meluas, menunjukkan penambahbaikan yang ketara dalam memahami konteks dan menjana tindak balas yang koheren berbanding dengan pendahulunya seperti ChATGPT 3.5. Perkembangan masa depan mungkin merangkumi lebih banyak Inter yang diperibadikan

Penjana Seni AI Terbaik (Percuma & amp; Dibayar) untuk projek kreatif Penjana Seni AI Terbaik (Percuma & amp; Dibayar) untuk projek kreatif Apr 02, 2025 pm 06:10 PM

Artikel ini mengkaji semula penjana seni AI atas, membincangkan ciri -ciri mereka, kesesuaian untuk projek kreatif, dan nilai. Ia menyerlahkan Midjourney sebagai nilai terbaik untuk profesional dan mengesyorkan Dall-E 2 untuk seni berkualiti tinggi dan disesuaikan.

O1 vs GPT-4O: Adakah model baru OpenAI ' lebih baik daripada GPT-4O? O1 vs GPT-4O: Adakah model baru OpenAI ' lebih baik daripada GPT-4O? Mar 16, 2025 am 11:47 AM

Openai's O1: Hadiah 12 Hari Bermula dengan model mereka yang paling berkuasa Ketibaan Disember membawa kelembapan global, kepingan salji di beberapa bahagian dunia, tetapi Openai baru sahaja bermula. Sam Altman dan pasukannya melancarkan mantan hadiah 12 hari

Google ' s Gencast: Peramalan Cuaca dengan Demo Mini Gencast Google ' s Gencast: Peramalan Cuaca dengan Demo Mini Gencast Mar 16, 2025 pm 01:46 PM

Google Deepmind's Gencast: AI Revolusioner untuk Peramalan Cuaca Peramalan cuaca telah menjalani transformasi dramatik, bergerak dari pemerhatian asas kepada ramalan berkuasa AI yang canggih. Google Deepmind's Gencast, tanah air

AI mana yang lebih baik daripada chatgpt? AI mana yang lebih baik daripada chatgpt? Mar 18, 2025 pm 06:05 PM

Artikel ini membincangkan model AI yang melampaui chatgpt, seperti Lamda, Llama, dan Grok, menonjolkan kelebihan mereka dalam ketepatan, pemahaman, dan kesan industri. (159 aksara)

See all articles