Perlumbaan untuk penalaran yang paling maju adalah pemanasan, dan persaingannya lebih sengit dari sebelumnya. Deepseek menendangnya dengan DeepSeek R1, diikuti oleh Openai's O3-Mini, dan kini Google telah memasuki barisan kuasa: Gemini 2.0 Flash, Flash Lite, Pro, dan dua model eksperimen-Flash 2.0 berfikir dan berfikir dengan aplikasi. Walaupun model Flash sudah membuat jalan ke dalam ujian awam, yang eksperimen dapat mentakrifkan semula penalaran dan integrasi aplikasi, mencabar O3-Mini dan DeepSeek-R1. Dalam blog ini, kami akan menyelam model -model baru ini, ciri -ciri unik mereka, dan kelebihan daya saing mereka. Mari kita menyelam!
Jadual KandunganModel eksperimen ini adalah model yang paling menarik oleh mana -mana syarikat AI. Bukan sahaja mereka menawarkan pemikiran yang kompleks dan pemikiran logik, tetapi mereka juga bekerja dengan aplikasi Google yang paling banyak digunakan seperti YouTube, peta, dan carian.
Ketersediaan: Model ini kini hanya tersedia untuk pelanggan Gemini Advanced pada aplikasi Gemini, sementara di studio Google AI, ia tersedia untuk semua secara percuma. Jadi jika anda tidak mempunyai akaun Gemini yang dibayar (yang dilengkapi dengan percubaan satu bulan percuma), anda boleh mencubanya di Google AI Studio.
Sekarang, mari kita uji pada aplikasi Gemini.
prompt: "Baca artikel di https://www.analyticsvidhya.com/blog/2024/07/building-agentic-rag-systems-with-langraph/ untuk memahami proses membuat data vektor untuk wikipedia. Kemudian, berikan ringkasan ringkas langkah -langkah utama. "
Response:
ulasan:
Model ini hebat untuk membaca melalui pautan web. Ia menghasilkan ringkasan yang jelas dan kemudian menyenaraikan langkah -langkah luas yang diliputi dalam blog. Oleh itu, Gemini Flash 2.0 membuktikan menjadi model yang cepat dan cekap yang cepat dengan mengakses Internet untuk menyelesaikan pertanyaan. Ia bagus untuk tugas-tugas yang berkaitan dengan kandungan sehari-hari dan juga untuk analisis imej dan generasi.Gemini 2.0 Flash Lite
Ketersediaan: Gemini 2.0 Flash Lite, boleh didapati secara percuma di Google AI Studio. Ia juga boleh didapati di Vertex AI, tetapi belum tersedia dalam aplikasi Gemini.
Cara Mengakses Gemini 2.0 Flash Lite
prompt: " Jelaskan imej berikut kepada saya dengan kata -kata yang mudah." Response:
"Imej ini menunjukkan agen AI berinteraksi dengan" dunia "dan pengguna. Berikut adalah pecahan:
Ketersediaan: Model ini juga hanya tersedia untuk pengguna berbayar Gemini maju pada aplikasi Gemini. Sementara itu pengguna boleh mengaksesnya secara percuma di studio Google AI dan Vertex AI. Jadi jika anda tidak mempunyai akaun Gemini yang dibayar (yang menawarkan percubaan satu bulan percuma), anda boleh mencubanya di Google AI Studio. Ketahui lebih lanjut: Google Gemini 2.0 Pro Eksperimen lebih baik daripada Openai O3-Mini? mari kita lihat bagaimana model ini berfungsi. prompt: "Selesaikan teka -teki ini dan beri saya meja yang terdiri daripada penyelesaiannya."
Response:
Model ini menerangkan penyelesaiannya dan mengikutinya dengan jadual penyelesaian, seperti yang diminta. Ia menghasilkan tindak balas yang betul berdasarkan maklumat yang diberikan, walaupun di beberapa tempat, ia menganggap nilai yang salah warna dan mata wang. Walau bagaimanapun, hasil akhir masih tidak terjejas kerana nilai -nilai tersebut tidak penting dalam tindak balas keseluruhan. Tidak perlu dikatakan, Gemini 2.0 Pro Eksperimental menggabungkan pemikiran yang kuat dengan kelajuan dan ketepatan.
Pada masa ini, model ini tersedia untuk pengguna aplikasi Gemini, hanya menawarkan beberapa pengguna akses awal kepada keupayaan lanjutannya.
Sekarang mari kita lihat apa model ini boleh dilakukan. prompt: "Anda berjalan ke bilik dan melihat katil. Di atas katil, terdapat dua anjing, empat kucing, jerapah, lima ekor lembu, dan itik. Terdapat juga tiga kerusi dan meja. Berapakah bilangan kaki di lantai? " "
Oleh itu, terdapat 18 kaki di atas lantai. "
ulasan:
Gemini 2.0 Flash Thinking Experimental With Apps
Model ini mempamerkan potensi LLM untuk menjadi sangat terintegrasi ke dalam kehidupan digital kami, dengan lancar berinteraksi dengan alat yang kami gunakan setiap hari. prompt: "Beritahu saya tentang semua laluan jalan yang mungkin saya ambil dari tempat saya ke stesen keretapi New Delhi. Saya sedang berada di sini: https://maps.app.goo.gl/xciqxpugasxtxytk8 " Response: " Berikut adalah laluan jalan yang mungkin ke stesen keretapi New Delhi dari lokasi semasa anda di K-3 Road, DLF Fasa 2, Sektor 25, Gurugram, Haryana 122022, India.
ulasan:
Hanya dalam beberapa saat, model itu berfikir melalui prompt, mengakses lokasi yang saya kongsi melalui peta, dan mencadangkan jalan terbaik untuk saya. Ia memberi saya butiran laluan dan berkongsi pautan peta untuk rujukan saya juga. Ciri sedemikian boleh menjadi tambahan hebat apabila mencari tempat di bandar baru atau untuk mencari alamat dengan cepat. LLM ini juga bagus untuk menyalin atau meringkaskan video YouTube yang panjang. Walaupun ia mengalami kesilapan semasa bekerja dengan seluar pendek YouTube. Model Gemini 2.0: Perbandingan penanda aras Sekarang bahawa kami telah bekerja dengan semua model terbaru Google, mari kita lihat dengan cepat bagaimana model -model ini dilakukan pada tanda aras yang berbeza. Butiran untuk berfikir model eksperimen belum tersedia oleh itu kita hanya akan bekerja dengan tiga model yang lain: Gemini 2.0 Flash, Flash Lite, dan Pro. Sumber: Google Deepmind Blog Setiap model baru mempunyai set ciri tersendiri. Dalam jadual berikut, saya telah menyenaraikan ciri -ciri dan aplikasi semua model yang telah kami pelajari di blog ini. barisan Google Gemini 2.0 menandakan langkah besar dalam keupayaan model AI generatif, yang menawarkan pelbagai model yang disesuaikan untuk kelajuan, kecekapan, dan penalaran maju. Walaupun Gemini 2.0 Flash dan Flash Lite memenuhi kes penggunaan tinggi dan kos efektif, Gemini 2.0 Pro Eksperimen kelihatan menjanjikan untuk pemahaman konteks panjang dan integrasi alat. Model eksperimen, terutamanya pemikiran kilat dan pemikiran flash dengan aplikasi, memperkenalkan kemungkinan untuk penalaran logik dan interaksi aplikasi lancar. Dengan Gemini 2.0, Google menetapkan peringkat untuk model genai yang lebih terperinci konteks, multimodal, dan sangat terintegrasi ke dalam ekosistem digital kami. Memandangkan model-model ini berkembang, kesannya terhadap aliran kerja yang didorong oleh AI, penjanaan kandungan, dan pengambilan keputusan masa nyata hanya akan berkembang. Direka untuk tugas-tugas yang tinggi, yang menawarkan kelajuan, dan kelajuan yang sama. Tersedia di Google AI Studio (percuma) dan Gemini Advanced (dibayar).
dunia: Ini mewakili persekitaran AI beroperasi, termasuk Internet, sistem pengendalian, pelayan API, perkakasan, dan dunia fizikal.
ejen AI:
input ke ai. llm
llm
Memory .
Proses ini berulang. "
meletakkan nilai -nilai ini di laman web:
ulasan:
sebagai model eksperimen, ia masih dalam pembangunan, tetapi ia menunjuk ke arah masa depan LLM yang boleh membuat alasan dan menyelesaikan masalah dengan lebih berkesan.
Model Flash Gemini 2.0 hanya tersedia dalam versi berbayar - Gemini Advanced, pada aplikasi Gemini. Walau bagaimanapun, di Google AI Studio, ia boleh didapati secara percuma. Jadi jika anda tidak mempunyai akaun Gemini yang dibayar (yang menawarkan percubaan percuma selama satu bulan), anda boleh mencubanya di Google AI Studio. Response:
Integrasinya dengan aplikasi luaran menjadikan model mampu bukan hanya alasan, tetapi juga mengambil tindakan dalam aplikasi yang berbeza. Ini membuka dunia kemungkinan untuk automasi aliran kerja yang kompleks.
Jadi, mari kita mengujinya.
Jarak: 16.4 batu
Model ini menggabungkan kuasa pemikiran, kelajuan, dan akses aplikasi luaran - semua dalam satu. Keupayaan sedemikian menunjukkan kehadiran yang kuat terhadap sifat agenik bahawa kita akan dapat melihat dengan model pemikiran ini.
Capability
Benchmark
Gemini 2.0 Flash-Lite (Public Preview)
Gemini 2.0 Flash (GA)
Gemini 2.0 Pro Experimental
General
MMLU-Pro
71.6%
77.6%
79.1%
Code
LiveCodeBench (v5)
28.9%
34.5%
36.0%
Code
Bird-SQL (Dev)
57.4%
58.7%
59.3%
Reasoning
GQPA (diamond)
51.5%
60.1%
64.7%
Factuality
SimpleQA
21.7%
29.9%
44.3%
Factuality
FACTS Grounding
83.6%
84.6%
82.8%
Multilingual
Global MMLU (Lite)
78.2%
83.4%
86.5%
Math
MATH
86.8%
90.9%
91.8%
Math
HiddenMath
55.3%
63.5%
65.2%
Long-context
MRCR (1M)
58.0%
70.5%
74.7%
Image
MMMU
68.0%
71.7%
72.7%
Audio
CoVoST2 (21 lang)
38.4%
39.0%
40.6%
Video
EgoSchema (test)
67.2%
71.1%
71.9%
Model Gemini 2.0: Perbandingan Ciri
Model
Context Window
Multimodal
Availability
Applications
Gemini 2.0 Flash
1 million
Yes
Generally available (incl. free in AI Studio)
Content summarization, data extraction, quick classification, basic question answering, high-throughput API services, real-time translation
Gemini 2.0 Flash Lite
1 million
Yes
Public preview
Mobile app features, basic chatbots, cost-sensitive document processing, educational tools for basic tasks, internal knowledge base lookup
Gemini 2.0 Pro Experimental
2 million
Yes
Experimental
Complex code generation, advanced data analysis, research assistants, sophisticated content creation, tool-integrated workflows (e.g., booking systems, CRM integrations), long-form content analysis
Gemini 2.0 Flash Thinking
N/A
Yes
Gemini app (Paid)
Real-time decision-making, fast-paced problem solving, dynamic pricing, fraud detection, fast response bots with enhanced reasoning, live customer support escalation
Gemini 2.0 Flash Thinking w/ Apps
N/A
Yes
Gemini app (Paid)
Complex automated workflows, interactive voice assistants with app actions, smart home automation, Robotic Process Automation (RPA), orchestration of AI services, automated scheduling and task management
Kesimpulan
Soalan Lazim
Q1. Apakah Gemini 2.0? a. Gemini 2.0 adalah model keluarga Gen AI terbaru Google yang direka untuk peningkatan penalaran, pemprosesan multimodal, dan tugas kecekapan tinggi. Ia termasuk flash, flash lite, pro, dan dua model percubaan -flash pemikiran dan pemikiran flash dengan aplikasi. Q2. Bagaimanakah Gemini 2.0 dibandingkan dengan Openai's O3-Mini dan DeepSeek R1? a. Model Gemini 2.0, terutamanya Siri Flash dan Pro, bersaing secara langsung dengan Openai's O3-Mini dan DeepSeek R1 dari segi penalaran, kecekapan, dan integrasi alat. Walaupun Flash Gemini 2.0 memberi tumpuan kepada kelajuan dan keberkesanan kos, Gemini 2.0 Pro Eksperimen cemerlang dalam penalaran dan pengekodan yang kompleks. Q3. Apakah perbezaan antara Gemini 2.0 Flash dan Flash Lite?
Q4. Berapa banyak model eksperimen yang terdapat di Gemini 2.0? a. Pada masa ini terdapat 2 model eksperimen dalam Gemini2.0:
a. Anda boleh mengakses model -model ini dengan cara berikut: Gemini 2.0 Flash:
Atas ialah kandungan terperinci Bagaimana cara mengakses model Google Gemini 2.0 secara percuma?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!