Jadual Kandungan
1. Sambungkan model dan data
2 Dari data kepada penggunaan AI generatif, sangat memendekkan masa
Rumah Peranti teknologi AI Mempercepatkan inovasi GenAI perusahaan dari hujung ke hujung, perkhidmatan mikro NVIDIA NIM telah menjadi kemuncak bagi syarikat perisian!

Mempercepatkan inovasi GenAI perusahaan dari hujung ke hujung, perkhidmatan mikro NVIDIA NIM telah menjadi kemuncak bagi syarikat perisian!

Mar 22, 2024 am 08:00 AM
perkhidmatan mikro NVIDIA genai

Mempercepatkan inovasi GenAI perusahaan dari hujung ke hujung, perkhidmatan mikro NVIDIA NIM telah menjadi kemuncak bagi syarikat perisian!

Syarikat pembangunan perisian Cloudera baru-baru ini mengumumkan perkongsian strategik dengan NVIDIA untuk mempercepatkan penggunaan aplikasi AI generatif. Kerjasama itu akan melibatkan penyepaduan perkhidmatan mikro AI NVIDIA ke dalam Cloudera Data Platform (CDP) dan direka bentuk untuk membantu perusahaan membina dan menskalakan model bahasa besar tersuai (LLM) dengan lebih cepat berdasarkan data mereka. Inisiatif ini akan menyediakan perusahaan dengan alat dan teknologi yang lebih berkuasa untuk menggunakan sumber data mereka dengan lebih baik dan mempercepatkan proses pembangunan dan penggunaan aplikasi AI. Kerjasama ini akan membawa lebih banyak peluang kepada perusahaan, membantu mereka membuat keputusan berasaskan data yang lebih cekap dan memacu pembangunan perniagaan. Kerjasama antara Cloudera dan NVIDIA akan menyediakan perusahaan dengan lebih banyak pilihan dan fleksibiliti, dan dijangka mempromosikan aplikasi meluas teknologi AI dalam pelbagai industri.

Dalam kerjasama ini, Cloudera merancang untuk memanfaatkan sepenuhnya teknologi NVIDIA AI Enterprise, termasuk perkhidmatan mikro NVIDIA Inference Manager (NIM), untuk mendedahkan cerapan daripada lebih daripada 25 exabait data dalam CDP. Maklumat perusahaan yang berharga ini akan diimport ke dalam platform pembelajaran mesin Cloudera, perkhidmatan aliran kerja AI hujung ke hujung yang disediakan oleh syarikat, direka untuk memacu pusingan baharu inovasi AI generatif.

Priyank Patel, VP Produk AI/ML di Cloudera, menyatakan bahawa data perusahaan yang digabungkan dengan platform tindanan penuh yang dioptimumkan untuk model bahasa besar adalah penting untuk memindahkan aplikasi AI generatif organisasi daripada perintis kepada pengeluaran. Cloudera kini sedang menyepadukan perkhidmatan mikro NVIDIA NIM dan CUDA-X untuk memacu platform pembelajaran mesinnya dan membantu pelanggan mengubah potensi AI menjadi realiti perniagaan.

Kerjasama ini menyerlahkan kekuatan Cloudera dan NVIDIA dalam inovasi teknologi dan juga menunjukkan permintaan pasaran yang berkembang pesat untuk aplikasi AI generatif. Dengan menyepadukan sumber dan kelebihan teknikal kedua-dua pihak, kami akan bersama-sama mempromosikan aplikasi praktikal AI dalam perusahaan dan menyediakan perusahaan dengan penyelesaian yang lebih cekap dan lebih bijak.

Selain itu, dengan memanfaatkan data besar-besaran dalam CDP dan menggabungkannya dengan keupayaan hebat platform pembelajaran mesin Cloudera, perusahaan boleh menggali lebih dalam nilai data dan mencapai keputusan yang lebih tepat dan operasi perniagaan yang lebih cekap. Kerjasama ini akan membawa masa depan yang lebih pintar dan automatik kepada perusahaan dan menggalakkan pembangunan dan kemajuan keseluruhan industri.

1. Sambungkan model dan data

Dalam menyambungkan model dan data, AI perusahaan menghadapi cabaran utama, iaitu cara menyambungkan model asas dengan data perniagaan yang berkaitan untuk menjana output yang tepat dan kontekstual. Perkhidmatan mikro NIM dan NeMo Retriever NVIDIA bertujuan untuk merapatkan jurang ini dengan membolehkan pembangun menyambungkan LLM (Model Bahasa Besar) dengan data perusahaan berstruktur dan tidak berstruktur daripada dokumen teks kepada imej dan visualisasi.

Secara khusus, Cloudera Machine Learning akan menyediakan keupayaan penyajian model NIM bersepadu untuk meningkatkan prestasi inferens dan membolehkan toleransi kesalahan, kependaman rendah dan penskalaan automatik dalam persekitaran hibrid dan berbilang awan. Penambahan NeMo Retriever akan memudahkan pembangunan aplikasi Retrieval Augmented Generation (RAG), yang meningkatkan ketepatan AI generatif dengan mendapatkan semula data yang berkaitan dalam masa nyata.

Antaranya, NVIDIA NeMo Retriever ialah perkhidmatan baharu dalam rangka kerja dan siri alat NVIDIA NeMo. NeMo ialah sekumpulan rangka kerja dan alatan untuk membina, menyesuaikan dan menggunakan model AI generatif. Sebagai perkhidmatan mikro perolehan semula semantik, NeMo Retriever menggunakan algoritma yang dioptimumkan NVIDIA untuk membantu aplikasi AI generatif membuat jawapan yang lebih tepat. Pembangun yang menggunakan perkhidmatan mikro ini boleh menyambungkan aplikasi AI mereka kepada data perniagaan yang terletak di pelbagai awan dan pusat data. Sambungan ini bukan sahaja meningkatkan ketepatan aplikasi AI, tetapi juga membolehkan pembangun memproses dan menggunakan data perusahaan dengan lebih fleksibel.

Ringkasnya, perkhidmatan mikro seperti NIM dan NeMo Retriever NVIDIA menyediakan perusahaan cara yang berkesan untuk menyepadukan model AI dengan data perniagaan untuk menjana output yang lebih tepat dan berguna. Ini memberikan perusahaan alat yang berkuasa untuk mempromosikan lagi aplikasi dan pembangunan AI dalam pelbagai bidang.

2 Dari data kepada penggunaan AI generatif, sangat memendekkan masa

Kerjasama antara NVIDIA dan Cloudera membuka pintu baharu untuk perusahaan, membawa mereka menggunakan data besar-besaran dengan lebih cekap untuk membina pembantu kolaboratif dan produktiviti tersuai alatan. Justin Boitano, naib presiden produk perusahaan di NVIDIA, berkata: "Penyepaduan perkhidmatan mikro NVIDIA NIM dengan platform data Cloudera menyediakan pembangun dengan cara yang lebih fleksibel dan lebih mudah untuk menggunakan model bahasa yang besar, dengan itu memacu transformasi perniagaan perusahaan

Dengan memudahkan laluan daripada data kepada penggunaan AI generatif, Cloudera dan NVIDIA menyasarkan untuk mempercepatkan penggunaan aplikasi transformatif perusahaan seperti pembantu pengekodan, chatbot, alat ringkasan dokumen dan alat carian semantik. Kerjasama ini dibina atas usaha kedua-dua syarikat sebelum ini untuk memanfaatkan pecutan GPU dengan menyepadukan NVIDIA RAPIDS ke dalam CDP.

Patel menyerlahkan faedah perniagaan daripada kerjasama yang diperluaskan, dengan menyatakan: “Selain menyediakan pelanggan dengan keupayaan dan prestasi AI generatif yang berkuasa, hasil daripada penyepaduan ini akan membolehkan perusahaan membuat keputusan yang lebih tepat dan tepat pada masanya mengurangkan ketidaktepatan, ilusi dan ralat dalam ramalan—ini adalah faktor kritikal dalam menavigasi persekitaran data hari ini.”

Cloudera akan diadakan di San Jose, California, 18-21 Mac NVIDIA GTC mempamerkan keupayaan AI generatifnya yang baharu. Semasa perusahaan terkemuka meneroka potensi model asas untuk mengubah operasi mereka, Cloudera dan NVIDIA percaya kerjasama mereka akan meletakkan pelanggan di barisan hadapan era baru AI perusahaan.

Atas ialah kandungan terperinci Mempercepatkan inovasi GenAI perusahaan dari hujung ke hujung, perkhidmatan mikro NVIDIA NIM telah menjadi kemuncak bagi syarikat perisian!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Model dialog NVIDIA ChatQA telah berkembang kepada versi 2.0, dengan panjang konteks disebut pada 128K Model dialog NVIDIA ChatQA telah berkembang kepada versi 2.0, dengan panjang konteks disebut pada 128K Jul 26, 2024 am 08:40 AM

Komuniti LLM terbuka ialah era apabila seratus bunga mekar dan bersaing Anda boleh melihat Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 dan banyak lagi. model yang cemerlang. Walau bagaimanapun, berbanding dengan model besar proprietari yang diwakili oleh GPT-4-Turbo, model terbuka masih mempunyai jurang yang ketara dalam banyak bidang. Selain model umum, beberapa model terbuka yang mengkhusus dalam bidang utama telah dibangunkan, seperti DeepSeek-Coder-V2 untuk pengaturcaraan dan matematik, dan InternVL untuk tugasan bahasa visual.

'Kilang AI' akan mempromosikan pembentukan semula keseluruhan susunan perisian, dan NVIDIA menyediakan bekas Llama3 NIM untuk digunakan oleh pengguna 'Kilang AI' akan mempromosikan pembentukan semula keseluruhan susunan perisian, dan NVIDIA menyediakan bekas Llama3 NIM untuk digunakan oleh pengguna Jun 08, 2024 pm 07:25 PM

Menurut berita dari laman web ini pada 2 Jun, pada ucaptama Huang Renxun 2024 Taipei Computex yang sedang berlangsung, Huang Renxun memperkenalkan kecerdasan buatan generatif akan mempromosikan pembentukan semula keseluruhan timbunan perisian dan menunjukkan perkhidmatan mikro asli awan NIM (Nvidia Inference Microservices). . Nvidia percaya bahawa "kilang AI" akan mencetuskan revolusi perindustrian baharu: mengambil industri perisian yang dipelopori oleh Microsoft sebagai contoh, Huang Renxun percaya bahawa kecerdasan buatan generatif akan menggalakkan pembentukan semula timbunan penuhnya. Untuk memudahkan penggunaan perkhidmatan AI oleh perusahaan dari semua saiz, NVIDIA melancarkan perkhidmatan mikro asli awan NIM (Nvidia Inference Microservices) pada Mac tahun ini. NIM+ ialah satu set perkhidmatan mikro asli awan yang dioptimumkan untuk mengurangkan masa ke pasaran

Nvidia bermain dengan pemangkasan dan penyulingan: mengurangkan separuh parameter Llama 3.1 8B untuk mencapai prestasi yang lebih baik dengan saiz yang sama Nvidia bermain dengan pemangkasan dan penyulingan: mengurangkan separuh parameter Llama 3.1 8B untuk mencapai prestasi yang lebih baik dengan saiz yang sama Aug 16, 2024 pm 04:42 PM

Kebangkitan model kecil. Bulan lepas, Meta mengeluarkan siri model Llama3.1, yang merangkumi model terbesar Meta setakat ini, model 405B, dan dua model yang lebih kecil dengan 70 bilion dan 8 bilion parameter masing-masing. Llama3.1 dianggap sebagai permulaan era baharu sumber terbuka. Walau bagaimanapun, walaupun model generasi baharu berkuasa dalam prestasi, ia masih memerlukan sejumlah besar sumber pengkomputeran apabila digunakan. Oleh itu, trend lain telah muncul dalam industri, iaitu membangunkan model bahasa kecil (SLM) yang berprestasi cukup baik dalam banyak tugas bahasa dan juga sangat murah untuk digunakan. Baru-baru ini, penyelidikan NVIDIA telah menunjukkan bahawa pemangkasan berat berstruktur digabungkan dengan penyulingan pengetahuan secara beransur-ansur boleh memperoleh model bahasa yang lebih kecil daripada model yang pada mulanya lebih besar. Pemenang Anugerah Turing, Ketua Meta A

Mematuhi spesifikasi NVIDIA SFF-Ready, ASUS melancarkan kad grafik siri Prime GeForce RTX 40 Mematuhi spesifikasi NVIDIA SFF-Ready, ASUS melancarkan kad grafik siri Prime GeForce RTX 40 Jun 15, 2024 pm 04:38 PM

Menurut berita dari laman web ini pada 15 Jun, Asus telah melancarkan kad grafik "Ada" siri Perdana siri GeForce RTX40 Saiznya mematuhi spesifikasi SFF-Ready terbaru Nvidia, yang memerlukan saiz kad grafik tidak melebihi 304. mm x 151 mm x 50 mm (panjang x tinggi x ketebalan ). Siri Perdana GeForceRTX40 siri yang dilancarkan oleh ASUS kali ini termasuk RTX4060Ti, RTX4070 dan RTX4070SUPER, tetapi pada masa ini ia tidak termasuk RTX4070TiSUPER atau RTX4080SUPER. Siri kad grafik RTX40 ini menggunakan reka bentuk papan litar biasa dengan dimensi 269 mm x 120 mm x 50 mm Perbezaan utama antara tiga kad grafik adalah

Nvidia mengeluarkan versi memori GDDR6 kad grafik GeForce RTX 4070, tersedia mulai September Nvidia mengeluarkan versi memori GDDR6 kad grafik GeForce RTX 4070, tersedia mulai September Aug 21, 2024 am 07:31 AM

Menurut berita dari laman web ini pada 20 Ogos, beberapa sumber melaporkan pada bulan Julai bahawa kad grafik Nvidia RTX4070 dan ke atas akan berada dalam bekalan yang ketat pada bulan Ogos kerana kekurangan memori video GDDR6X. Selepas itu, spekulasi tersebar di Internet tentang melancarkan versi memori GDDR6 kad grafik RTX4070. Seperti yang dilaporkan oleh laman web ini sebelum ini, Nvidia hari ini mengeluarkan pemacu GameReady untuk "Black Myth: Wukong" dan "Star Wars: Outlaws" Pada masa yang sama, siaran akhbar itu juga menyebut keluaran versi memori video GDDR6 GeForce RTX4070. Nvidia menyatakan bahawa spesifikasi RTX4070 baharu selain daripada memori video akan kekal tidak berubah (sudah tentu, ia juga akan terus mengekalkan harga 4,799 yuan), memberikan prestasi yang serupa dengan versi asal dalam permainan dan aplikasi, dan produk berkaitan akan dilancarkan daripada

Rangka Kerja PHP dan Perkhidmatan Mikro: Penerapan dan Pengkontenaan Asli Awan Rangka Kerja PHP dan Perkhidmatan Mikro: Penerapan dan Pengkontenaan Asli Awan Jun 04, 2024 pm 12:48 PM

Faedah menggabungkan rangka kerja PHP dengan perkhidmatan mikro: Kebolehskalaan: Memanjangkan aplikasi dengan mudah, menambah ciri baharu atau mengendalikan lebih banyak beban. Fleksibiliti: Perkhidmatan mikro digunakan dan diselenggara secara bebas, menjadikannya lebih mudah untuk membuat perubahan dan kemas kini. Ketersediaan tinggi: Kegagalan satu perkhidmatan mikro tidak menjejaskan bahagian lain, memastikan ketersediaan yang lebih tinggi. Kes praktikal: Menggunakan perkhidmatan mikro menggunakan Laravel dan Kubernetes Langkah: Buat projek Laravel. Tentukan pengawal perkhidmatan mikro. Buat fail Docker. Buat manifes Kubernetes. Sebarkan perkhidmatan mikro. Uji perkhidmatan mikro.

Model universal sumber terbuka paling berkuasa NVIDIA Nemotron-4 340B Model universal sumber terbuka paling berkuasa NVIDIA Nemotron-4 340B Jun 16, 2024 pm 10:32 PM

Prestasi melebihi Llama-3 dan digunakan terutamanya untuk data sintetik. Model besar kegunaan umum NVIDIA Nemotron telah menggunakan sumber terbuka versi 340 bilion parameter terkini. Pada hari Jumaat, NVIDIA mengumumkan pelancaran Nemotron-4340B. Ia mengandungi satu siri model terbuka yang boleh digunakan oleh pembangun untuk menjana data sintetik untuk melatih model bahasa besar (LLM), yang boleh digunakan untuk aplikasi komersial dalam semua industri seperti penjagaan kesihatan, kewangan, pembuatan dan peruncitan. Data latihan berkualiti tinggi memainkan peranan penting dalam responsif, ketepatan dan kualiti LLM tersuai—tetapi set data yang mantap selalunya mahal dan tidak boleh diakses. Melalui lesen model terbuka yang unik, Nemotron-4340B menyediakan pembangun dengan

NVIDIA melancarkan spesifikasi casis saiz kecil Sedia SFF: 15 pengeluar kad grafik dan casis mengambil bahagian untuk memastikan keserasian kad grafik dan casis NVIDIA melancarkan spesifikasi casis saiz kecil Sedia SFF: 15 pengeluar kad grafik dan casis mengambil bahagian untuk memastikan keserasian kad grafik dan casis Jun 07, 2024 am 11:51 AM

Menurut berita dari laman web ini pada 2 Jun, Nvidia telah bekerjasama dengan pengeluar kad grafik dan casis untuk memperkenalkan secara rasmi spesifikasi SFF-Ready untuk kad grafik dan casis permainan GeForce RTX, memudahkan proses pemilihan aksesori untuk casis bersaiz kecil. Menurut laporan, pada masa ini terdapat 15 pengeluar kad grafik dan casis yang mengambil bahagian dalam projek SFF-Ready, termasuk ASUS, Cooler Master, dan Teknologi Perpisahan. Kad grafik permainan SFF-Ready GeForce adalah untuk model RTX4070 dan ke atas Keperluan saiz adalah seperti berikut: Ketinggian maksimum: 151mm, termasuk jejari lentur kord kuasa Panjang maksimum: 304mm Ketebalan maksimum: 50mm atau 2.5 slot Mulai 2 Jun 2024, terdapat. ialah 36 kad grafik siri GeForce RTX40 Mematuhi spesifikasi, lebih banyak kad grafik akan tersedia pada masa hadapan

See all articles