>最先進的推理LLM的競賽正在加熱,比賽比以往任何時候都更加激烈。 DeepSeek用DeepSeek R1啟動了它,其次是OpenAI的O3-Mini,現在Google進入了強大的陣容:Gemini 2.0 Flash,Flash Lite,Pro和兩個實驗模型 - Flash 2.0 2.0思考和對應用程序進行思考。儘管Flash模型已經進入公共測試,但實驗性的模型可以重新定義推理和應用程序集成,挑戰O3-Mini和DeepSeek-R1。在此博客中,我們將研究這些新模型,它們的獨特功能及其競爭優勢。讓我們潛入!
目錄的目的表
>什麼是Gemini 2.0?實驗性- gemini 2.0 flash Thinking flash Thinking apps
- gemini 2.0模型:基準比較
-
-
什麼是Gemini 2.0? -
Gemini 2.0是Google最新多模型的傘。這些模型是由Google開發的,可以看到代理時代對高延遲且性能提高的高效士兵模型的需求。在Gemini 2.0系列中,以下模型已經發佈到目前為止:
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
- gemini 2.0 Pro實驗
-
>與這些強大的模型一起,Google還秘密發布了目前處於實驗階段的另外兩個模型。這兩個型號是:
Gemini 2.0 Flash思考實驗
gemini 2.0 flash用應用程序
進行實驗
-
這些實驗模型是迄今為止任何AI公司最令人興奮的模型。它們不僅提供了複雜的推理和邏輯思維,而且還可以與Google最常用的應用程序(如YouTube,地圖和搜索)一起使用。 - >
所以,讓我們探索Google的每一個最新版本,一一。
- Gemini 2.0 Flash
閃光燈模型是為大容量的高頻任務而設計的,優先考慮速度和效率。 Gemini 2.0 Flash現在公開可供所有人使用,使其適用於生產應用程序。這是該模型的關鍵特徵:
- >它可以通過100萬個令牌的巨大上下文窗口來處理繁重的任務並執行多模式推理。
- >在Gemini應用程序以及通過Google AI Studio和Vertex AI中的Gemini API中可以訪問。
- 該模型與OpenAI的GPT-4O,DeepSeek的V3和Qwen-2.5相媲美,其速度和效率在處理任務方面。
>
可用性:當前僅適用於Gemini高級訂戶在Gemini應用程序上使用,而在Google AI Studio中,可以免費使用。因此,如果您沒有付費的Gemini帳戶(免費的一個月試用),則可以在Google AI Studio中嘗試。 >
現在,讓我們在Gemini應用程序上進行測試。
提示:“在https://www.analyticsvidhya.com/blog/2024/07/building-agentic-agentic-rag-systems-with-langgraph/上閱讀文章,以了解為Wikipedia數據創建矢量數據庫的過程。然後,提供關鍵步驟的簡明摘要。
響應:
>評論:
>模型擅長通過Web鏈接閱讀。它產生了一個明確的摘要,然後列出了博客中涵蓋的廣泛步驟。因此,Gemini Flash 2.0被證明是一個快速有效的模型,可以通過訪問Internet進行求解查詢而迅速。這對於日常內容相關的任務以及圖像分析和生成非常有用。 >
Gemini 2.0 Flash Lite
Flash Lite模型的設計考慮了成本效益。它建立在其前任1.5閃存的基礎上,在保持同樣令人印象深刻的速度和負擔能力的同時,可以顯著提高質量。以下是其中的一些亮點:
2.0 Flash Lite是尋求績效和預算之間平衡的開發人員的絕佳選擇。
該模型擁有100萬個令牌上下文窗口,並支持多模式輸入,從而可以處理各種任務。
>
>目前正在公共預覽中,可通過Google AI Studio和Vertex AI的Gemini API訪問。這使開發人員可以實驗並將Flash Lite集成到他們的工作流程中。
- >可用性:
- Gemini 2.0 Flash Lite,可在Google AI Studio中免費使用。它也可以在Vertex AI中使用,但在Gemini App中尚未可用。
>
- >如何訪問Gemini 2.0 Flash Lite
要在Google AI Studio中使用Gemini 2.0 Flash Lite,您將必須:
>在網頁上註冊。
完成後,單擊左側面板中的“創建提示符”。 >
>從右側面板,“型號”部分下,選擇“ Gemini 2.0 Flash Lite 02-05”。
讓我們對其進行測試。 -
- 提示:
- “
>
>用簡單的單詞向我解釋以下圖像。
響應:
“此圖像顯示了與“世界”和用戶相互作用的AI代理。這是一個故障:
-
世界:這代表了AI在內的環境,包括Internet,操作系統,API服務器,硬件和物理世界。
- ai代理: >中央框代表AI代理,該代理從用戶接收輸入並與世界互動。它由多個部分組成:
用戶:-
>與AI互動的人。它們提供了AI的輸入。
llm(大語言模型):
>- > AI的大腦。它接收信息,處理並做出決定。
>工具:
>- > 該部分包含AI可以用來與世界交互的各種工具(網站API,應用程序,應用程序,Shell,Database等)。
內存:
- > AI的內存,它存儲和檢索信息(例如RAM,SQL數據庫和Vectordbs中的數據)。
> action:
>- > AI的操作模塊,使AI執行了LLM生成的指令。
>它如何工作:
- 用戶>
> ai。
-
> llm
-
> 處理此輸入。
>
- llm > > action
>工具> > world
-
>>> > 內存
這個過程重複
評論:
響應以對圖像的小介紹開始。然後,它描述了圖像的每個部分,然後分解所有單個元素。最後,它簡要說明了圖像的所有組件如何工作。該型號很快起作用!很快將圖像分析並將圖像分解為簡單的解釋。對於需要速度的任務,例如為客戶查詢解決方案或Q/A會議構建聊天機器人以及面試準備; Gemini 2.0 Flash Lite是理想的。
gemini 2.0 Pro實驗
Gemini 2.0 Pro實驗代表雙子座家族關於能力的巔峰。它設計用於解決最複雜的任務,尤其是涉及編碼的任務。以下是有關Gemini 2.0 Pro的實驗版本的一些要點
- 這個最新模型具有200萬個令牌上下文窗口,使其能夠處理並了解大量信息。
>它具有撥打Google搜索和直接執行代碼等工具的獨特能力,從而大大擴展了其解決問題的潛力。
- 當前,在實驗階段,Gemini 2.0 Pro實驗在更廣泛的釋放之前進行了完善和測試。
- >
可用性:此模型也僅適用於Gemini Appl上的Gemini Advanced的付費用戶。同時,用戶可以在Google AI Studio和Vertex AI中免費訪問它。因此,如果您沒有付費的雙子座帳戶(提供一個月的免費試用),則可以在Google AI Studio中嘗試。 >
了解更多:Google Gemini 2.0比Openai O3-Mini更好的實驗?
>讓我們看一下該模型的性能。
> 提示:
>
>“解決這個難題,給我由解決方案組成的表。
這個難題是從以下網站中獲取的。
響應:
將這些值放在網站上:
>評論:
>該模型解釋了其解決方案,並按照提示進行解決方案表。它根據給出的信息產生了正確的響應,儘管在幾個地方,它確實假定了顏色和貨幣的不正確值。但是,其最終結果仍然不受影響,因為這些值在整體響應中無關緊要。不用說,Gemini 2.0 Pro實驗確實將強大的推理與速度和準確性相結合。
Gemini 2.0 Flash思考實驗
> Flash Thinking實驗模型是一個令人興奮的發展,它結合了Gemini 2.0 Flash的速度和效率和增強的推理能力。這使其不僅可以快速處理信息,還可以將邏輯思維應用於復雜的問題。
>當前,該模型可用於雙子座應用程序的用戶,僅提供一些用戶的早期訪問其高級功能的訪問。
作為一個實驗模型,它仍在開發中,但它指向LLM的未來,可以更有效地推理和解決問題。
>可用性:
Gemini 2.0 Flash模型僅在付費版本中可用 - Gemini Advanced,在Gemini App上。但是,在Google AI工作室中,可以免費使用。因此,如果您沒有付費的Gemini帳戶(提供一個月的免費試用版),則可以在Google AI Studio中嘗試。
- 現在讓我們看看這個型號可以做什麼。
>提示:>“你走進房間看床。在床上,有兩隻狗,四隻貓,一隻長頸鹿,五頭牛和一隻鴨子。還有三把椅子和一張桌子。地板上有幾條腿?
響應:
“
>讓我們分解:>
>>床上的東西:狗,貓,長頸鹿,牛,鴨。這些動物在床上,所以它們的腿不在地板上。
- >>房間裡的東西(除非另有說明,否則可能在地板上)
> - 椅子:椅子有腿,通常在地板上。每個椅子有4個腿,有3椅。
表:桌子有腿,它們通常在地板上。桌子通常有4個腿,有1個表。
您:您走進房間。據推測,您站著或走路,雙腿在地板上。你有2條腿。
-
-
讓我們計算地板上的腿:
- 椅子:3椅子 * 4腿/椅子= 12腿
>
表:1個表 * 4腿/表= 4腿
>
你:1人 * 2腿/人= 2腿
>
-
地板上的總腿> :12 4 2 = 18腿
- >
因此,地板上有18條腿。
>評論:
-
這個問題的正確答案是22,其中包括3張椅子的12張腿,桌子的4腿,4張床的4腿和2腿。 Gemini 2.0 Flash實驗思維模型展示了出色的思維,對單個腿(大多數LLM都錯過的東西)說明了。然而,它忘了在床的腿上數。因此,即使很棒,該模型也可以更好地在邏輯推理上。
gemini 2.0 flash用應用程序
進行實驗
>在Flash思考實驗模型的基礎上,使用應用程序版本的Flash Thinking實驗增加了至關重要的交互層:與外部應用程序互動的能力。這是使其成為強大模型的原因:
它與外部應用程序的集成使該模型不僅能夠成為理性,還可以在不同的應用程序中採取行動。這為複雜工作流程自動化的可能性開闢了世界。
>
該模型展示了LLM深入我們的數字生活的潛力,與我們每天使用的工具無縫互動。
>>可用性:
gemini 2.0閃光燈僅在付費版本中可用 - gemini Advanced。同時,在Google AI工作室中,可以免費使用。因此,如果您沒有付費的Gemini帳戶(免費的一個月試用),則可以在Google AI Studio中嘗試。 >
所以,讓我們進行測試。 >
提示:>“告訴我我可以從我的位置到新德里火車站的所有可能路線。我目前在這裡:https://maps.app.goo.gl/xciqxpugasxtxytk8”
響應:
“這是您目前在印度哈里亞納邦Gurugram的K-3 Road的新德里火車站的可能路線,印度Haryana 122022。
>
這是您位於印度哈里亞納邦Gurugram 25號地區K-3 Road的新德里火車站的可能路線,
路線1:通過NH 48
>
距離:16.4英里
- 持續時間:大約49分鐘
>
-
摘要:此路線主要遵循NH 48。
>
- >映射URL
-
>這是當前提供的唯一路由。如果您想探索替代路線,則可以指定標準,例如避免高速公路或通行費,我可以檢查這些選項。
評論:
>在短短幾秒鐘內,該模型通過提示進行思考,訪問我通過地圖共享的位置,並為我提出了最佳的路徑。它為我提供了路線的詳細信息,並共享一個地圖鏈接以供我的參考。在尋找新城市的地方或快速定位地址時,這樣的功能可能是一個很好的補充。此LLM也非常適合轉錄或總結長YouTube視頻。儘管它在使用YouTube短褲時會遇到錯誤。 >
該模型結合了推理,速度和外部應用程序可訪問性的力量 - 一組。這樣的功能表明,我們很快就會看到這些思維模型。
Gemini 2.0型號:基準比較
>現在我們已經與Google所有最新型號合作,讓我們快速研究這些模型在不同基準測試中的性能。思考實驗模型的詳細信息尚不可用,因此我們將僅使用其餘三個模型:Gemini 2.0 Flash,Flash Lite和Pro。
Capability |
Benchmark |
Gemini 2.0 Flash-Lite (Public Preview) |
Gemini 2.0 Flash (GA) |
Gemini 2.0 Pro Experimental |
General |
MMLU-Pro |
71.6% |
77.6% |
79.1% |
Code |
LiveCodeBench (v5) |
28.9% |
34.5% |
36.0% |
Code |
Bird-SQL (Dev) |
57.4% |
58.7% |
59.3% |
Reasoning |
GQPA (diamond) |
51.5% |
60.1% |
64.7% |
Factuality |
SimpleQA |
21.7% |
29.9% |
44.3% |
Factuality |
FACTS Grounding |
83.6% |
84.6% |
82.8% |
Multilingual |
Global MMLU (Lite) |
78.2% |
83.4% |
86.5% |
Math |
MATH |
86.8% |
90.9% |
91.8% |
Math |
HiddenMath |
55.3% |
63.5% |
65.2% |
Long-context |
MRCR (1M) |
58.0% |
70.5% |
74.7% |
Image |
MMMU |
68.0% |
71.7% |
72.7% |
Audio |
CoVoST2 (21 lang) |
38.4% |
39.0% |
40.6% |
Video |
EgoSchema (test) |
67.2% |
71.1% |
71.9% |
來源:Google DeepMind博客
Gemini 2.0型號:功能比較
>每個新型號都有自己獨特的功能集。在下表中,我列出了我們在此博客中探索的所有模型的功能和應用。
結論
Google的Gemini 2.0陣容標誌著生成AI模型功能的重要一步,為速度,效率和高級推理提供了定制的各種型號。 Gemini 2.0 Flash和Flash Lite迎合了高通量和成本效益的用例,而Gemini 2.0 Pro實驗看起來很有希望,可用於長篇文化的理解和工具集成。實驗模型,尤其是使用應用程序的Flash Thinking和Flash Thinking,引入了邏輯推理和無縫應用程序交互的可能性。
Google使用Gemini 2.0
為Genai模型奠定了基礎,這些模型更感知了上下文,多模式並深入整合到我們的數字生態系統中。隨著這些模型的發展,它們對AI驅動的工作流,內容產生和實時決策的影響只會增長。
常見問題
> Q1。什麼是Gemini 2.0? Gemini 2.0是Google最新的AI Gen AI模型系列,旨在增強推理,多模式處理和高效任務。它包括Flash,Flash Lite,Pro和兩個實驗模型 - 使用應用程序的Flash Thinking和Flash Thinks。 Gemini 2.0與Openai的O3-Mini和DeepSeek R1相比如何? Gemini 2.0型號,尤其是Flash和Pro系列,就推理,效率和工具集成而言,直接與OpenAI的O3-Mini和DeepSeek R1競爭。 Gemini 2.0 Flash專注於速度和成本效益,而Gemini 2.0 Pro實驗在復雜的推理和編碼方面表現出色。 Gemini 2.0 Flash和Flash Lite有什麼區別? Gemini 2.0 Flash Lite之間的關鍵差異如下:
Gemini 2.0 Flash:>專為高通量任務而設計,提供速度,效率和1M令牌上下文窗口。 gemini 2.0 2.0 flash lite lite lite lite lite:
適用於預算
> Q4。 Gemini 2.0中有多少個實驗模型? Gemini2.0中的當前有2個實驗模型:
flash思維實驗:增強了邏輯推理和解決問題的方法。
使用應用程序的閃光思考:構建思維模型,但基於思維模型,但與Google搜索,Maps和YouTube和YouTube等外部應用程序集成在一起,實現了現實的互動。如何訪問Gemini 2.0型號?您可以通過以下方式訪問這些模型:gemini 2.0 flash:
>在Google AI Studio(免費)中可用,而Vertex ai。用戶。 gemini 2.0 Pro實驗:
在Google AI Studio(免費)和Gemini Advanced(付費)中可用
以上是如何免費訪問Google Gemini 2.0型號?的詳細內容。更多資訊請關注PHP中文網其他相關文章!