Bagaimana cara mengakses model Google Gemini 2.0 secara percuma?-AI-php.cn

Perlumbaan untuk penalaran yang paling maju adalah pemanasan, dan persaingannya lebih sengit dari sebelumnya. Deepseek menendangnya dengan DeepSeek R1, diikuti oleh Openai's O3-Mini, dan kini Google telah memasuki barisan kuasa: Gemini 2.0 Flash, Flash Lite, Pro, dan dua model eksperimen-Flash 2.0 berfikir dan berfikir dengan aplikasi. Walaupun model Flash sudah membuat jalan ke dalam ujian awam, yang eksperimen dapat mentakrifkan semula penalaran dan integrasi aplikasi, mencabar O3-Mini dan DeepSeek-R1. Dalam blog ini, kami akan menyelam model -model baru ini, ciri -ciri unik mereka, dan kelebihan daya saing mereka. Mari kita menyelam!

Jadual Kandungan

Gemini 2.0 Model: Ciri -ciri Perbandingan

Apa itu Gemini 2.0?

Gemini 2.0 adalah payung model multimodal terkini oleh Google. Model -model ini telah dibangunkan oleh Google, mengekalkan tuntutan era agentik untuk model kerja keras yang sangat cekap dengan latensi rendah dan prestasi yang dipertingkatkan. Dalam siri Gemini 2.0, model berikut telah dikeluarkan setakat ini:
Bersama dengan model -model yang berkuasa ini, Google juga secara rahsia mengeluarkan dua model lain yang kini berada dalam fasa eksperimen mereka. Kedua -dua model adalah:

Gemini 2.0 Flash Thinking Experimental With Apps

Model eksperimen ini adalah model yang paling menarik oleh mana -mana syarikat AI. Bukan sahaja mereka menawarkan pemikiran yang kompleks dan pemikiran logik, tetapi mereka juga bekerja dengan aplikasi Google yang paling banyak digunakan seperti YouTube, peta, dan carian.

Jadi, mari kita meneroka setiap siaran terbaru ini oleh Google, satu demi satu.
Gemini 2.0 Flash
Model Flash direka untuk tugas tinggi, tugas frekuensi tinggi, mengutamakan kelajuan dan kecekapan. Gemini 2.0 Flash kini tersedia secara terbuka untuk semua orang, menjadikannya sesuai untuk aplikasi pengeluaran. Berikut adalah ciri utama model ini:

Ia boleh mengendalikan tugas berat dan melakukan penalaran multimodal dengan tetingkap konteks yang besar sebanyak 1 juta token.
Ia boleh diakses dalam aplikasi Gemini dan melalui API Gemini di Google AI Studio dan Vertex AI.
Model ini setanding dengan Openai's GPT-4O, DeepSeek's V3, dan Qwen-2.5 dengan kelajuan dan kecekapannya dalam tugas pengendalian.

Ketersediaan: Model ini kini hanya tersedia untuk pelanggan Gemini Advanced pada aplikasi Gemini, sementara di studio Google AI, ia tersedia untuk semua secara percuma. Jadi jika anda tidak mempunyai akaun Gemini yang dibayar (yang dilengkapi dengan percubaan satu bulan percuma), anda boleh mencubanya di Google AI Studio.

Sekarang, mari kita uji pada aplikasi Gemini.

prompt: "Baca artikel di https://www.analyticsvidhya.com/blog/2024/07/building-agentic-rag-systems-with-langraph/ untuk memahami proses membuat data vektor untuk wikipedia. Kemudian, berikan ringkasan ringkas langkah -langkah utama. "

Response:

Bagaimana cara mengakses model Google Gemini 2.0 secara percuma?

ulasan:

Model ini hebat untuk membaca melalui pautan web. Ia menghasilkan ringkasan yang jelas dan kemudian menyenaraikan langkah -langkah luas yang diliputi dalam blog. Oleh itu, Gemini Flash 2.0 membuktikan menjadi model yang cepat dan cekap yang cepat dengan mengakses Internet untuk menyelesaikan pertanyaan. Ia bagus untuk tugas-tugas yang berkaitan dengan kandungan sehari-hari dan juga untuk analisis imej dan generasi.

Gemini 2.0 Flash Lite

Model Lite Flash direka dengan keberkesanan kos dalam fikiran. Ia dibina pada pendahulunya, 1.5 Flash, menawarkan peningkatan kualiti yang ketara sambil mengekalkan kelajuan dan kemampuan yang sama. Berikut adalah beberapa sorotannya:

Ketersediaan: Gemini 2.0 Flash Lite, boleh didapati secara percuma di Google AI Studio. Ia juga boleh didapati di Vertex AI, tetapi belum tersedia dalam aplikasi Gemini.

Cara Mengakses Gemini 2.0 Flash Lite

untuk menggunakan Lite Flash Gemini 2.0 di studio Google AI, anda perlu:

mari kita uji.

prompt: " Jelaskan imej berikut kepada saya dengan kata -kata yang mudah."

Bagaimana cara mengakses model Google Gemini 2.0 secara percuma?

Response:

"Imej ini menunjukkan agen AI berinteraksi dengan" dunia "dan pengguna. Berikut adalah pecahan:

~~dunia: Ini mewakili persekitaran AI beroperasi, termasuk Internet, sistem pengendalian, pelayan API, perkakasan, dan dunia fizikal. ejen AI:~~
Kotak pusat mewakili agen AI, yang menerima input dari pengguna dan berinteraksi dengan dunia. Ia terdiri daripada pelbagai bahagian: Pengguna:
1. Orang berinteraksi dengan AI. Mereka memberikan input kepada AI. llm (model bahasa besar):
2. otak AI. Ia menerima maklumat, memprosesnya, dan membuat keputusan. Alat:
3. Bahagian ini mengandungi pelbagai alat yang boleh digunakan oleh AI untuk berinteraksi dengan dunia (API laman web, aplikasi, shell, pangkalan data, dll.) Memori ingatan: memori AI, di mana ia menyimpan dan mengambil maklumat (seperti data dalam RAM, pangkalan data SQL, dan vectordbs).
4. modul pengambilan tindakan AI, menjadikan AI melaksanakan arahan yang dihasilkan oleh LLM.
5. pengguna
input ke ai.

The

memproses input ini. the
~~llm tindakan .~~

Alat Memory . Proses ini berulang. " ulasan: Respons bermula dengan pengenalan kecil mengenai imej. Ia kemudian menerangkan setiap bahagian imej dan kemudian ia memecahkan semua elemen individu. Akhirnya, ia secara ringkas menerangkan bagaimana semua komponen kerja imej. Model ini berfungsi dengan cepat! Ia cepat menganalisis dan memecahkan imej ke dalam penjelasan mudah. Untuk tugas yang memerlukan kelajuan, seperti membina chatbots untuk resolusi pertanyaan pelanggan atau sesi Q/A, dan penyediaan wawancara; Gemini 2.0 Flash Lite akan menjadi ideal. Gemini 2.0 Pro Experimental Gemini 2.0 Pro Experimental mewakili puncak keluarga Gemini mengenai keupayaan. Ia direkayasa untuk menangani tugas -tugas yang paling kompleks, terutamanya yang melibatkan pengekodan. Berikut adalah beberapa perkara yang perlu diperhatikan mengenai versi eksperimen Gemini 2.0 Pro:

Model terbaru ini mempunyai tetingkap konteks 2 juta token yang besar, membolehkannya memproses dan memahami sejumlah besar maklumat.

Ia mempunyai keupayaan unik untuk memanggil alat seperti carian Google dan melaksanakan kod secara langsung, dengan ketara memperluaskan potensi penyelesaian masalahnya.

Pada masa ini, dalam fasa eksperimen, Eksperimen Gemini 2.0 Pro sedang ditapis dan diuji sebelum pelepasan yang lebih luas.

Ketersediaan: Model ini juga hanya tersedia untuk pengguna berbayar Gemini maju pada aplikasi Gemini. Sementara itu pengguna boleh mengaksesnya secara percuma di studio Google AI dan Vertex AI. Jadi jika anda tidak mempunyai akaun Gemini yang dibayar (yang menawarkan percubaan satu bulan percuma), anda boleh mencubanya di Google AI Studio.

Ketahui lebih lanjut: Google Gemini 2.0 Pro Eksperimen lebih baik daripada Openai O3-Mini?

mari kita lihat bagaimana model ini berfungsi.

prompt: "Selesaikan teka -teki ini dan beri saya meja yang terdiri daripada penyelesaiannya."

Teka -teki ini telah diperoleh dari laman web berikut.

Response:

~~meletakkan nilai -nilai ini di laman web:~~

ulasan:

Model ini menerangkan penyelesaiannya dan mengikutinya dengan jadual penyelesaian, seperti yang diminta. Ia menghasilkan tindak balas yang betul berdasarkan maklumat yang diberikan, walaupun di beberapa tempat, ia menganggap nilai yang salah warna dan mata wang. Walau bagaimanapun, hasil akhir masih tidak terjejas kerana nilai -nilai tersebut tidak penting dalam tindak balas keseluruhan. Tidak perlu dikatakan, Gemini 2.0 Pro Eksperimental menggabungkan pemikiran yang kuat dengan kelajuan dan ketepatan.
Gemini 2.0 Flash Thinking Experimental

Model Eksperimen Pemikiran Flash adalah perkembangan yang menarik yang menggabungkan kelajuan dan kecekapan Flash Gemini 2.0 dengan kebolehan penalaran yang dipertingkatkan. Ini membolehkan ia tidak hanya memproses maklumat dengan cepat tetapi juga menggunakan pemikiran logik kepada masalah yang kompleks.

Pada masa ini, model ini tersedia untuk pengguna aplikasi Gemini, hanya menawarkan beberapa pengguna akses awal kepada keupayaan lanjutannya.

sebagai model eksperimen, ia masih dalam pembangunan, tetapi ia menunjuk ke arah masa depan LLM yang boleh membuat alasan dan menyelesaikan masalah dengan lebih berkesan.

Ketersediaan:
Model Flash Gemini 2.0 hanya tersedia dalam versi berbayar - Gemini Advanced, pada aplikasi Gemini. Walau bagaimanapun, di Google AI Studio, ia boleh didapati secara percuma. Jadi jika anda tidak mempunyai akaun Gemini yang dibayar (yang menawarkan percubaan percuma selama satu bulan), anda boleh mencubanya di Google AI Studio.
Sekarang mari kita lihat apa model ini boleh dilakukan.

prompt: "Anda berjalan ke bilik dan melihat katil. Di atas katil, terdapat dua anjing, empat kucing, jerapah, lima ekor lembu, dan itik. Terdapat juga tiga kerusi dan meja. Berapakah bilangan kaki di lantai? "

Response:

" mari kita pecahkan ini:

Perkara di atas katil: anjing, kucing, zirafah, lembu, itik. Haiwan ini berada di atas katil, jadi kaki mereka tidak berada di lantai.

perkara di dalam bilik (dan mungkin di lantai kecuali dinyatakan sebaliknya):

kerusi: kerusi mempunyai kaki, dan mereka biasanya di atas lantai. Setiap kerusi mempunyai 4 kaki, dan terdapat 3 kerusi. Jadual: Jadual: Jadual mempunyai kaki, dan mereka biasanya di atas lantai. Jadual biasanya mempunyai 4 kaki, dan terdapat 1 jadual.

Anda: Anda masuk ke dalam bilik. Mungkin, anda berdiri atau berjalan, dan kaki anda berada di atas lantai. Anda mempunyai 2 kaki.

mari kita mengira kaki di lantai:

kerusi: 3 kerusi * 4 kaki/kerusi = 12 kaki

jadual: 1 jadual * 4 kaki/jadual = 4 kaki

anda: 1 orang * 2 kaki/person = 2 kaki

Jumlah kaki di lantai: 12 4 2 = 18 kaki

Oleh itu, terdapat 18 kaki di atas lantai. "

ulasan:
Jawapan yang betul untuk soalan ini adalah 22 yang merangkumi 12 kaki dari 3 kerusi, 4 kaki meja, 4 kaki katil, dan 2 kaki orang itu. Model Pemikiran Eksperimen Gemini 2.0 mempamerkan pemikiran yang cemerlang, menyumbang kaki individu (sesuatu yang kebanyakannya terlepas). Namun, ia terlupa untuk dikira di kaki katil. Oleh itu, walaupun hebat, model itu boleh menjadi lebih baik pada penalaran logik.
Gemini 2.0 Flash Thinking Experimental With Apps
Membina model percubaan Flash Thinking, Flash Thinking Experimental dengan versi APPS menambah lapisan interaktiviti yang penting: keupayaan untuk berinteraksi dengan aplikasi luaran. Inilah yang menjadikannya model yang kuat:

Integrasinya dengan aplikasi luaran menjadikan model mampu bukan hanya alasan, tetapi juga mengambil tindakan dalam aplikasi yang berbeza. Ini membuka dunia kemungkinan untuk automasi aliran kerja yang kompleks.

Model ini mempamerkan potensi LLM untuk menjadi sangat terintegrasi ke dalam kehidupan digital kami, dengan lancar berinteraksi dengan alat yang kami gunakan setiap hari.

Ketersediaan:
Gemini 2.0 Flash hanya tersedia dalam versi berbayar - Gemini Advanced. Sementara itu, di studio Google AI, ia boleh didapati secara percuma. Jadi jika anda tidak mempunyai akaun Gemini yang dibayar (yang dilengkapi dengan percubaan satu bulan percuma), anda boleh mencubanya di Google AI Studio.

Jadi, mari kita mengujinya.

prompt: "Beritahu saya tentang semua laluan jalan yang mungkin saya ambil dari tempat saya ke stesen keretapi New Delhi. Saya sedang berada di sini: https://maps.app.goo.gl/xciqxpugasxtxytk8 "

Response:

" Berikut adalah laluan jalan yang mungkin ke stesen keretapi New Delhi dari lokasi semasa anda di K-3 Road, DLF Fasa 2, Sektor 25, Gurugram, Haryana 122022, India.
Berikut adalah laluan jalan yang mungkin ke stesen keretapi New Delhi dari lokasi anda di K-3 Road, DLF Fasa 2, Sektor 25, Gurugram, Haryana 122022, India:

Laluan 1: melalui NH 48

Jarak: 16.4 batu

Tempoh: Kira -kira 49 minit
Ringkasan: Laluan ini terutamanya mengikuti NH 48 .

url peta

Ini adalah satu -satunya laluan yang disediakan. Jika anda ingin meneroka laluan alternatif, anda boleh menentukan kriteria seperti mengelakkan lebuh raya atau tol, dan saya boleh menyemak pilihan tersebut. "

ulasan: Hanya dalam beberapa saat, model itu berfikir melalui prompt, mengakses lokasi yang saya kongsi melalui peta, dan mencadangkan jalan terbaik untuk saya. Ia memberi saya butiran laluan dan berkongsi pautan peta untuk rujukan saya juga. Ciri sedemikian boleh menjadi tambahan hebat apabila mencari tempat di bandar baru atau untuk mencari alamat dengan cepat. LLM ini juga bagus untuk menyalin atau meringkaskan video YouTube yang panjang. Walaupun ia mengalami kesilapan semasa bekerja dengan seluar pendek YouTube.

Model ini menggabungkan kuasa pemikiran, kelajuan, dan akses aplikasi luaran - semua dalam satu. Keupayaan sedemikian menunjukkan kehadiran yang kuat terhadap sifat agenik bahawa kita akan dapat melihat dengan model pemikiran ini.

Model Gemini 2.0: Perbandingan penanda aras

Sekarang bahawa kami telah bekerja dengan semua model terbaru Google, mari kita lihat dengan cepat bagaimana model -model ini dilakukan pada tanda aras yang berbeza. Butiran untuk berfikir model eksperimen belum tersedia oleh itu kita hanya akan bekerja dengan tiga model yang lain: Gemini 2.0 Flash, Flash Lite, dan Pro.

Capability Benchmark Gemini 2.0 Flash-Lite (Public Preview) Gemini 2.0 Flash (GA) Gemini 2.0 Pro Experimental

General MMLU-Pro 71.6% 77.6% 79.1%

Code LiveCodeBench (v5) 28.9% 34.5% 36.0%

Code Bird-SQL (Dev) 57.4% 58.7% 59.3%

Reasoning GQPA (diamond) 51.5% 60.1% 64.7%

Factuality SimpleQA 21.7% 29.9% 44.3%

Factuality FACTS Grounding 83.6% 84.6% 82.8%

Multilingual Global MMLU (Lite) 78.2% 83.4% 86.5%

Math MATH 86.8% 90.9% 91.8%

Math HiddenMath 55.3% 63.5% 65.2%

Long-context MRCR (1M) 58.0% 70.5% 74.7%

Image MMMU 68.0% 71.7% 72.7%

Audio CoVoST2 (21 lang) 38.4% 39.0% 40.6%

Video EgoSchema (test) 67.2% 71.1% 71.9%

Sumber: Google Deepmind Blog

Model Gemini 2.0: Perbandingan Ciri

Setiap model baru mempunyai set ciri tersendiri. Dalam jadual berikut, saya telah menyenaraikan ciri -ciri dan aplikasi semua model yang telah kami pelajari di blog ini.

Model Context Window Multimodal Availability Applications

Gemini 2.0 Flash 1 million Yes Generally available (incl. free in AI Studio) Content summarization, data extraction, quick classification, basic question answering, high-throughput API services, real-time translation

Gemini 2.0 Flash Lite 1 million Yes Public preview Mobile app features, basic chatbots, cost-sensitive document processing, educational tools for basic tasks, internal knowledge base lookup

Gemini 2.0 Pro Experimental 2 million Yes Experimental Complex code generation, advanced data analysis, research assistants, sophisticated content creation, tool-integrated workflows (e.g., booking systems, CRM integrations), long-form content analysis

Gemini 2.0 Flash Thinking N/A Yes Gemini app (Paid) Real-time decision-making, fast-paced problem solving, dynamic pricing, fraud detection, fast response bots with enhanced reasoning, live customer support escalation

Gemini 2.0 Flash Thinking w/ Apps N/A Yes Gemini app (Paid) Complex automated workflows, interactive voice assistants with app actions, smart home automation, Robotic Process Automation (RPA), orchestration of AI services, automated scheduling and task management

Kesimpulan

barisan Google Gemini 2.0 menandakan langkah besar dalam keupayaan model AI generatif, yang menawarkan pelbagai model yang disesuaikan untuk kelajuan, kecekapan, dan penalaran maju. Walaupun Gemini 2.0 Flash dan Flash Lite memenuhi kes penggunaan tinggi dan kos efektif, Gemini 2.0 Pro Eksperimen kelihatan menjanjikan untuk pemahaman konteks panjang dan integrasi alat. Model eksperimen, terutamanya pemikiran kilat dan pemikiran flash dengan aplikasi, memperkenalkan kemungkinan untuk penalaran logik dan interaksi aplikasi lancar.

Dengan Gemini 2.0, Google menetapkan peringkat untuk model genai yang lebih terperinci konteks, multimodal, dan sangat terintegrasi ke dalam ekosistem digital kami. Memandangkan model-model ini berkembang, kesannya terhadap aliran kerja yang didorong oleh AI, penjanaan kandungan, dan pengambilan keputusan masa nyata hanya akan berkembang.

Soalan Lazim
Q1. Apakah Gemini 2.0? a. Gemini 2.0 adalah model keluarga Gen AI terbaru Google yang direka untuk peningkatan penalaran, pemprosesan multimodal, dan tugas kecekapan tinggi. Ia termasuk flash, flash lite, pro, dan dua model percubaan -flash pemikiran dan pemikiran flash dengan aplikasi.
~~Q2. Bagaimanakah Gemini 2.0 dibandingkan dengan Openai's O3-Mini dan DeepSeek R1?~~
a. Model Gemini 2.0, terutamanya Siri Flash dan Pro, bersaing secara langsung dengan Openai's O3-Mini dan DeepSeek R1 dari segi penalaran, kecekapan, dan integrasi alat. Walaupun Flash Gemini 2.0 memberi tumpuan kepada kelajuan dan keberkesanan kos, Gemini 2.0 Pro Eksperimen cemerlang dalam penalaran dan pengekodan yang kompleks. Q3. Apakah perbezaan antara Gemini 2.0 Flash dan Flash Lite?

a. Perbezaan utama antara Gemini 2.0 flash dan flash lite adalah seperti berikut: Gemini 2.0 Flash:
Direka untuk tugas-tugas yang tinggi, yang menawarkan kelajuan, dan kelajuan yang sama.
Q4. Berapa banyak model eksperimen yang terdapat di Gemini 2.0? ~~a. Pada masa ini terdapat 2 model eksperimen dalam Gemini2.0: Bagaimana saya boleh mengakses model Gemini 2.0?~~
a. Anda boleh mengakses model -model ini dengan cara berikut: Gemini 2.0 Flash:
tersedia di Google AI Studio (percuma) dan Vertex Ai. Pengguna. Gemini 2.0 Pro Eksperimen:
Tersedia di Google AI Studio (percuma) dan Gemini Advanced (dibayar).

Capability	Benchmark	Gemini 2.0 Flash-Lite (Public Preview)	Gemini 2.0 Flash (GA)	Gemini 2.0 Pro Experimental
General	MMLU-Pro	71.6%	77.6%	79.1%
Code	LiveCodeBench (v5)	28.9%	34.5%	36.0%
Code	Bird-SQL (Dev)	57.4%	58.7%	59.3%
Reasoning	GQPA (diamond)	51.5%	60.1%	64.7%
Factuality	SimpleQA	21.7%	29.9%	44.3%
Factuality	FACTS Grounding	83.6%	84.6%	82.8%
Multilingual	Global MMLU (Lite)	78.2%	83.4%	86.5%
Math	MATH	86.8%	90.9%	91.8%
Math	HiddenMath	55.3%	63.5%	65.2%
Long-context	MRCR (1M)	58.0%	70.5%	74.7%
Image	MMMU	68.0%	71.7%	72.7%
Audio	CoVoST2 (21 lang)	38.4%	39.0%	40.6%
Video	EgoSchema (test)	67.2%	71.1%	71.9%

Model	Context Window	Multimodal	Availability	Applications
Gemini 2.0 Flash	1 million	Yes	Generally available (incl. free in AI Studio)	Content summarization, data extraction, quick classification, basic question answering, high-throughput API services, real-time translation
Gemini 2.0 Flash Lite	1 million	Yes	Public preview	Mobile app features, basic chatbots, cost-sensitive document processing, educational tools for basic tasks, internal knowledge base lookup
Gemini 2.0 Pro Experimental	2 million	Yes	Experimental	Complex code generation, advanced data analysis, research assistants, sophisticated content creation, tool-integrated workflows (e.g., booking systems, CRM integrations), long-form content analysis
Gemini 2.0 Flash Thinking	N/A	Yes	Gemini app (Paid)	Real-time decision-making, fast-paced problem solving, dynamic pricing, fraud detection, fast response bots with enhanced reasoning, live customer support escalation
Gemini 2.0 Flash Thinking w/ Apps	N/A	Yes	Gemini app (Paid)	Complex automated workflows, interactive voice assistants with app actions, smart home automation, Robotic Process Automation (RPA), orchestration of AI services, automated scheduling and task management

Atas ialah kandungan terperinci Bagaimana cara mengakses model Google Gemini 2.0 secara percuma?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!