Rumah > Peranti teknologi > AI > Empat cara untuk mengoptimumkan pusat data anda untuk menampung beban kerja AI

Empat cara untuk mengoptimumkan pusat data anda untuk menampung beban kerja AI

PHPz
Lepaskan: 2023-12-14 16:51:51
ke hadapan
1190 orang telah melayarinya

Empat cara untuk mengoptimumkan pusat data anda untuk menampung beban kerja AI

AI dijangka mengubah pusat data dalam pelbagai cara, seperti menukar pasaran kerja pusat data dan menambah baik pemantauan pusat data dan operasi tindak balas insiden.

Walau bagaimanapun, kesan terbesar kecerdasan buatan yang mungkin ada pada pusat data ialah mengubah cara pusat data berfungsi. Bagi perusahaan yang ingin menggunakan sepenuhnya teknologi kecerdasan buatan moden, infrastruktur yang terkandung dalam pusat data dan cara ia diurus mesti berubah

Pembangunan AI dalam pusat data akan membawa satu siri perubahan utama yang patut dilihat Walau bagaimanapun, Impak yang tepat masih dapat dilihat

Tuntutan unik AI pada pusat data

Untuk menilai kesan AI pada pusat data, anda perlu memahami terlebih dahulu bagaimana beban kerja AI dibandingkan dengan jenis beban kerja lain dalam pusat data, seperti pengehosan aplikasi standard Perbezaan antara

Walaupun beban kerja kecerdasan buatan (AI) datang dalam pelbagai bentuk dan mempunyai keperluan yang berbeza, kebanyakannya mempunyai keperluan unik berikut:

  • Memerlukan sumber pengkomputeran yang ketara, terutamanya apabila melaksanakan latihan model. .
  • Manfaat daripada berjalan pada perkakasan logam kosong, terutamanya pelayan dengan akses kepada sumber GPU.
  • Kadar penggunaan sumber mungkin turun naik dengan ketara. Semasa fasa latihan, beban kerja AI memerlukan banyak sumber, tetapi selepas latihan selesai, penggunaan sumber menurun dengan ketara dalam kebanyakan kes sehingga model dilatih semula.
  • Rangkaian kependaman ultra rendah diperlukan untuk membuat keputusan dan menyampaikan hasil dalam masa nyata.

Sudah tentu, terdapat jenis beban kerja lain yang mungkin mempunyai keperluan ini. Contohnya, menjalankan aplikasi dan perkhidmatan kecerdasan buatan bukanlah satu-satunya kes penggunaan yang boleh mendapat manfaat daripada pelayan logam kosong. Tetapi secara amnya, perisian AI memerlukan lebih banyak sumber di atas daripada jenis beban kerja lain

Menaik taraf pusat data untuk AI

Untuk mengoptimumkan kemudahan untuk beban kerja AI, banyak pengendali pusat data perlu membuat Perubahan untuk memenuhi keperluan unik AI. Berikut ialah peningkatan pusat data utama dalam hal ini.

  1. Reka bentuk semula atau gantikan pelayan logam kosong

Mesin maya telah menjadi sumber infrastruktur pilihan untuk mengehos beban kerja sepanjang dekad yang lalu. Walau bagaimanapun, apabila permintaan untuk perkakasan logam terdedah meningkat untuk aplikasi dan perkhidmatan AI, semakin ramai pengendali pusat data mungkin menyedari kepentingan mengembangkan tawaran logam terdedah mereka

Dalam beberapa cara, ini sebenarnya memudahkan operasi pusat data. Jika anda menjalankan beban kerja pada logam kosong, anda akan mendapat timbunan pengehosan yang kurang kompleks kerana anda tidak mempunyai gabungan hypervisor dan orkestra VM.

Sebaliknya, untuk menskalakan beban kerja pengehosan infrastruktur logam kosong, kemas kini dan peningkatan pada pelayan pengehosan dan rak di pusat data mungkin diperlukan. Secara tradisinya, cara paling mudah untuk menyediakan pelayan di pusat data adalah dengan menyediakan mesin logam kosong yang berkuasa dan memberikannya kepada sebarang bilangan mesin maya berdasarkan keperluan beban kerja. Walau bagaimanapun, jika beban kerja perlu dijalankan terus pada logam kosong, lebih banyak pelayan mungkin diperlukan untuk mengasingkan beban kerja - bermakna pusat data perlu menggantikan pelayan berkuasa tinggi dengan yang lebih kecil dan mengemas kini rak pelayan dengan sewajarnya

  1. Kongsi GPU- pelayan yang didayakan

Pengoperasian aplikasi AI sehari-hari tidak semestinya memerlukan sokongan GPU, walaupun menggunakan pelayan GPU boleh memberi manfaat semasa latihan untuk beban kerja AI. Oleh itu, banyak perusahaan hanya memerlukan akses sementara kepada infrastruktur yang didayakan GPU

Untuk memenuhi keperluan perusahaan untuk infrastruktur GPU yang dikongsi, pengendali pusat data harus mempertimbangkan untuk menyediakan produk berkaitan. Sesetengah perusahaan hanya memerlukan pelayan yang dilengkapi GPU dalam beberapa kes, jadi pengendali pusat data boleh menyediakan akses kepada sumber GPU buat sementara waktu melalui GPU-sebagai-perkhidmatan untuk menarik lebih baik perusahaan tersebut dengan keperluan beban kerja AI

  1. Penyelesaian Rangkaian yang Dipertingkatkan

Kebanyakan pusat data kelas perusahaan sudah mempunyai akses kepada infrastruktur rangkaian berprestasi tinggi dan menyediakan perkhidmatan saling sambungan untuk mengalihkan data dengan pantas ke kemudahan luaran. Walau bagaimanapun, untuk merealisasikan sepenuhnya kuasa kecerdasan buatan, produk rangkaian pusat data mungkin perlu lebih berkuasa

Perusahaan yang mempunyai beban kerja kecerdasan buatan perlu mempunyai dua keupayaan utama: Pertama, mereka memerlukan sambungan rangkaian lebar jalur tinggi yang boleh dengan cepat memindahkan data dalam jumlah yang besar, amat penting apabila melatih model AI pada infrastruktur teragih. Kedua, rangkaian perlu menyediakan kependaman rendah, yang penting untuk aplikasi dan perkhidmatan AI yang ingin mencapai pelaksanaan masa nyata

  1. Fleksibiliti pusat data yang lebih besar

Memandangkan keperluan sumber beban kerja AI sangat berubah-ubah, pusat data yang lebih fleksibel dari segi jumlah infrastruktur yang mereka boleh sokong mungkin diperlukan. AI juga mungkin meningkatkan permintaan untuk perkhidmatan yang membolehkan syarikat menggunakan pelayan atas permintaan di pusat data lain dan bukannya menyediakan pelayan tersebut sendiri, kerana infrastruktur atas permintaan ialah cara yang baik untuk mengambil kira turun naik permintaan sumber.

Untuk tujuan ini, pengendali pusat data yang ingin mengoptimumkan AI harus mempertimbangkan produk yang menjadikan kemudahan mereka lebih fleksibel. Gabungan kontrak dan perkhidmatan jangka pendek yang merangkumi lebih daripada sekadar ruang rak di mana pelanggan boleh membina infrastruktur mereka sendiri mungkin menarik kepada organisasi yang perlu menggunakan beban kerja AI.

Kesimpulan

Revolusi AI masih berlangsung, dan masih terlalu awal untuk mengetahui dengan tepat cara AI akan mengubah cara pusat data beroperasi atau jenis infrastruktur yang digunakan di dalamnya. Tetapi apa yang agak pasti ialah perubahan seperti pelayan yang didayakan GPU dan penyelesaian yang lebih fleksibel mungkin menjadi kritikal dalam dunia tertumpu AI. Pengendali pusat data yang mahukan sekeping pai harus memastikan mengemas kini kemudahan mereka untuk memenuhi keperluan unik beban kerja AI.

Atas ialah kandungan terperinci Empat cara untuk mengoptimumkan pusat data anda untuk menampung beban kerja AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan