


Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi
Selasa ini, Google mengeluarkan satu siri kemas kini model dan produk berkaitan AI di Google Cloud Next 2024, termasuk Gemini 1.5 Pro yang menyediakan fungsi pemahaman pertuturan (pertuturan) tempatan buat kali pertama, model penjanaan kod baharu CodeGemma, yang pertama Pemproses Lengan yang dibangunkan sendiri Axion dan sebagainya.
Gemini 1.5 Pro
Gemini 1.5 Pro, model AI generatif Google yang paling berkuasa, kini tersedia dalam pratonton awam pada Vertex AI, platform pembangunan AI tertumpu perusahaan Google. Ini ialah platform pembangunan AI Google untuk perusahaan. Konteks yang ia boleh mengendalikan peningkatan daripada 128,000 token kepada 1 juta token. Satu juta token adalah bersamaan dengan kira-kira 700,000 perkataan, atau kira-kira 30,000 baris kod. Itu kira-kira empat kali ganda jumlah data model utama Anthropic yang boleh dikendalikan oleh Claude 3 sebagai input, dan kira-kira lapan kali ganda jumlah konteks maksimum OpenAI GPT-4 Turbo.
Pautan teks asal rasmi: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
Ini versi Buat pertama kalinya, keupayaan pemahaman audio (pertuturan) tempatan dan API fail baharu disediakan untuk memudahkan pemprosesan fail. Mod input Gemini 1.5 Pro sedang dikembangkan untuk memasukkan pemahaman audio (pertuturan) dalam API Gemini dan Google AI Studio. Selain itu, Gemini 1.5 Pro kini boleh melakukan inferens pada imej (bingkai) dan audio (pertuturan) video yang dimuat naik dalam Google AI Studio.
Anda boleh memuat naik rakaman kuliah, seperti kuliah ini dengan lebih 117,000 token oleh Jeff Dean, dan Gemini 1.5 Pro boleh menukarnya menjadi ujian dengan jawapan. (Demo telah dipercepatkan)
Google juga telah membuat penambahbaikan dalam API Gemini, terutamanya termasuk tiga kandungan berikut:
Pada masa ini, arahan sistem boleh digunakan dalam Google AI Studio dan Gemini API untuk membimbing tindak balas model . Tentukan peranan, format, matlamat dan peraturan untuk membimbing tingkah laku model untuk kes penggunaan khusus anda.
Tetapkan perintah sistem dengan mudah dalam Google AI Studio
2: Arahkan model untuk mengeluarkan objek JSON sahaja. Corak ini memungkinkan untuk mengekstrak data berstruktur daripada teks atau imej. cURL kini tersedia, dengan sokongan Python SDK akan datang tidak lama lagi.
3. Penambahbaikan untuk fungsi panggilan: Kini anda boleh memilih mod untuk mengehadkan output model dan meningkatkan kebolehpercayaan. Pilih teks, panggilan fungsi atau hanya fungsi itu sendiri.
Selain itu, Google akan mengeluarkan model pembenaman teks generasi seterusnya yang mengatasi model yang serupa. Mulai hari ini, pembangun akan dapat mengakses model pembenaman teks generasi akan datang melalui API Gemini. Model baharu ini, text-embedding-004 (text-embedding-preview-0409 dalam Vertex AI), mencapai prestasi perolehan semula yang lebih kukuh pada penanda aras MTEB dan mengatasi model sedia ada dengan dimensi yang setanding.
Dalam penanda aras MTEB, Text-embedding-004 (aka Gecko) menggunakan output 256 malap mengatasi semua model output 768 malap yang lebih besar
Walau bagaimanapun, Pro5 tidak sepatutnya tersedia untuk Gemini 1. mereka yang tidak mempunyai akses kepada Vertex AI dan AI Studio. Pada masa ini, kebanyakan orang terlibat dengan model bahasa Gemini melalui chatbot Gemini. Gemini Ultra memperkasakan chatbot Gemini Advanced, dan walaupun ia berkuasa dan boleh memahami arahan yang panjang, ia tidak sepantas Gemini 1.5 Pro.
Tiga alatan sumber terbuka utama
Pada persidangan Google Cloud Next pada tahun 2024, syarikat itu melancarkan berbilang alatan sumber terbuka, terutamanya digunakan untuk menyokong projek dan infrastruktur AI generatif. Satu ialah Max Diffusion, yang merupakan koleksi pelaksanaan rujukan pelbagai model resapan yang dijalankan pada peranti XLA (Accelerated Linear Algebra).
Alamat GitHub: https://github.com/google/maxdiffusion
Yang kedua ialah Jetstream, enjin baharu untuk menjalankan model AI generatif. Pada masa ini, JetStream hanya menyokong TPU, tetapi mungkin serasi dengan GPU pada masa hadapan. Google mendakwa bahawa JetStream boleh menyampaikan sehingga 3x ganda harga/prestasi model seperti Gemma 7B milik Google dan Llama 2 Meta.
Alamat GitHub: https://github.com/google/JetStream
Yang ketiga ialah MaxTest, yang merupakan penjanaan teks dan model koleksi AI Nvidia untuk GPU TPU . MaxText kini termasuk Gemma 7B, OpenAI's GPT-3, Llama 2, dan model daripada pemula AI Mistral, yang semuanya dikatakan Google boleh disesuaikan dan disesuaikan dengan keperluan pembangun. . pemproses Lengan pemproses Lengan dibangunkan, dipanggil Axion. Ia berdasarkan Arm's Neoverse 2 dan direka untuk pusat data. Google mengatakan kejadian Axionnya berprestasi 30% lebih baik daripada contoh berasaskan Arm lain daripada pesaing seperti AWS dan Microsoft, dan prestasi sehingga 50% lebih baik dan 60% lebih cekap tenaga berbanding tika berasaskan X86 yang sepadan.
Google menekankan semasa acara pelancaran Selasa bahawa kerana Axion dibina di atas asas terbuka, pelanggan Google Cloud akan dapat membawa beban kerja Arm sedia ada mereka ke Google Cloud tanpa sebarang pengubahsuaian.
Walau bagaimanapun, Google masih belum mengeluarkan sebarang pengenalan terperinci mengenai perkara ini.
Alat penyiapan dan penjanaan kod - CodeGemma
CodeGemma mempunyai kelebihan berikut:
Penyiapan dan penjanaan kod pintar: baris lengkap, fungsi, malah menjana keseluruhan blok kod, sama ada anda bekerja secara tempatan atau dalam awan
; Ketepatan lebih tinggi: CodeGemma terutamanya menggunakan data bahasa Inggeris sebanyak 500 bilion token daripada dokumen dalam talian, matematik dan kod untuk latihan Kod yang dijana bukan sahaja lebih tepat dari segi tatabahasa, tetapi juga lebih bermakna dari segi semantik, membantu mengurangkan ralat dan masa penyahpepijatan
Keupayaan berbilang bahasa: Menyokong Python, JavaScript, Java dan bahasa pengaturcaraan popular yang lainAliran kerja yang dipermudah: Integrasikan CodeGemma ke dalam persekitaran pembangunan anda untuk menulis kod boilerplate yang kurang dan berfungsi dengan lebih pantas Tulis kod yang penting, menarik dan membezakan. . Beberapa hasil perbandingan antara
CodeGemma dan model besar kod arus perdana yang lain ditunjukkan dalam rajah di bawah:
- Hasil perbandingan antara model CodeGemma 7B dan model Gemma 7B, model MATH GSM8K dan set data yang lain
- Untuk butiran lanjut teknikal dan keputusan percubaan, sila rujuk kertas kerja yang dikeluarkan serentak oleh Google.
Alamat kertas: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf
Model bahasa terbuka - RecurrentGemma
Google DeepMind turut mengeluarkan satu siri model bahasa berat terbuka - RecurrentGemma. RecurrentGemma adalah berdasarkan seni bina Griffin, yang membolehkan inferens pantas apabila menjana jujukan panjang dengan menggantikan perhatian global dengan campuran perhatian tempatan dan ulangan linear.
Laporan teknikal: https://storage.googleapis.com/deepmind-media/gemma/recurrentgemma-report.pdf
RecurrentGemma-2B mencapai prestasi unggul pada tugas hiliran dengan Gemma -2B (seni bina pengubah) adalah setanding.
Pada masa yang sama, RecurrentGemma-2B mencapai daya pemprosesan yang lebih tinggi semasa inferens, terutamanya pada jujukan yang panjang.
Alat penyuntingan video - Google Vids
Google Vids ialah alat penciptaan video AI dan ciri baharu yang ditambahkan dalam Google Workspace.
Google mengatakan bahawa dengan Google Vids, pengguna boleh membuat video bersama alatan Workspace lain seperti Dokumen dan Helaian serta bekerjasama dengan rakan sekerja dalam masa nyata.
Pembantu kod khusus perusahaan - Gemini Code Assist
Gemini Code Assist ialah alat pelengkap dan bantuan kod AI untuk perusahaan, yang ditanda aras dengan GitHub Copilot Enterprise. Code Assist akan tersedia sebagai pemalam untuk editor popular seperti VS Code dan JetBrains.
Sumber imej: https://techcrunch.com/2024/04/09/google-launches-code-assist-its-latest-challenger-to-githubs-copilot/
Code Assist Dikuasakan oleh Gemini 1.5 Pro. Gemini 1.5 Pro mempunyai tetingkap konteks jutaan token, yang membolehkan alatan Google memperkenalkan lebih banyak konteks berbanding pesaing. Google mengatakan ini bermakna Code Assist boleh memberikan cadangan kod yang lebih tepat dan keupayaan untuk membuat alasan dan menukar sebahagian besar kod.
Google berkata: "Bantuan Kod membolehkan pelanggan membuat perubahan besar-besaran pada keseluruhan pangkalan kod mereka, membolehkan transformasi kod dibantu AI yang sebelum ini mustahil
Pembina Ejen - Vertex AI
." perisikan adalah hala tuju pembangunan industri yang hangat tahun ini. Google kini telah mengumumkan alat baharu untuk membantu perusahaan membina ejen AI – Vertex AI Agent Builder.
Thomas Kurian, Ketua Pegawai Eksekutif Google Cloud, berkata: “Pembina Ejen Vertex AI menjadikannya amat mudah dan pantas untuk membina dan menggunakan ejen perbualan generatif yang didorong oleh AI yang sedia pengeluaran yang boleh membimbing manusia dalam Panduan ejen dalam cara untuk meningkatkan kualiti dan ketepatan model hasil yang dihasilkan."
Atas ialah kandungan terperinci Satu kejayaan penuh, Google mengemas kini sejumlah besar produk model besar malam tadi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



PHP dan Python masing -masing mempunyai kelebihan mereka sendiri, dan memilih mengikut keperluan projek. 1.PHP sesuai untuk pembangunan web, terutamanya untuk pembangunan pesat dan penyelenggaraan laman web. 2. Python sesuai untuk sains data, pembelajaran mesin dan kecerdasan buatan, dengan sintaks ringkas dan sesuai untuk pemula.

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Panduan ini akan membimbing anda untuk belajar cara menggunakan syslog dalam sistem Debian. SYSLOG adalah perkhidmatan utama dalam sistem Linux untuk sistem pembalakan dan mesej log aplikasi. Ia membantu pentadbir memantau dan menganalisis aktiviti sistem untuk mengenal pasti dan menyelesaikan masalah dengan cepat. 1. Pengetahuan asas syslog Fungsi teras syslog termasuk: mengumpul dan menguruskan mesej log secara terpusat; menyokong pelbagai format output log dan lokasi sasaran (seperti fail atau rangkaian); Menyediakan fungsi tontonan log dan penapisan masa nyata. 2. Pasang dan konfigurasikan syslog (menggunakan rsyslog) Sistem Debian menggunakan rsyslog secara lalai. Anda boleh memasangnya dengan arahan berikut: sudoaptupdatesud

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Untuk memaksimumkan kecekapan pembelajaran Python dalam masa yang terhad, anda boleh menggunakan modul, masa, dan modul Python. 1. Modul DateTime digunakan untuk merakam dan merancang masa pembelajaran. 2. Modul Masa membantu menetapkan kajian dan masa rehat. 3. Modul Jadual secara automatik mengatur tugas pembelajaran mingguan.

Mengkonfigurasi pelayan HTTPS pada sistem Debian melibatkan beberapa langkah, termasuk memasang perisian yang diperlukan, menghasilkan sijil SSL, dan mengkonfigurasi pelayan web (seperti Apache atau Nginx) untuk menggunakan sijil SSL. Berikut adalah panduan asas, dengan mengandaikan anda menggunakan pelayan Apacheweb. 1. Pasang perisian yang diperlukan terlebih dahulu, pastikan sistem anda terkini dan pasang Apache dan OpenSSL: sudoaptDateSudoaptgradesudoaptinsta

Menguruskan Log Hadoop pada Debian, anda boleh mengikuti langkah-langkah berikut dan amalan terbaik: Agregasi log membolehkan pengagregatan log: tetapkan benang.log-agregasi-enable untuk benar dalam fail benang-site.xml untuk membolehkan pengagregatan log. Konfigurasikan dasar pengekalan log: tetapkan yarn.log-aggregasi.Retain-seconds Untuk menentukan masa pengekalan log, seperti 172800 saat (2 hari). Nyatakan Laluan Penyimpanan Log: Melalui Benang
