在Openai著名版本(例如GPT-4O,Sora和O1)的一年中,開源社區一直以其令人印象深刻的模型穩步發展。其中包括DeepSeek V3,這是一種開源模型,預算僅為550萬美元,比GPT-4O(1億美元)的培訓成本低得多。 DeepSeek V3擁有6850億參數和混合特性(MOE)體系結構,在編碼和翻譯等領域競爭,同時提供了成本效率和開源柔韌性。讓我們探討DeepSeek V3與GPT-4O的比較以及它為AI開髮帶來的餐桌帶來了什麼。
提示:創建一個全面的流程圖,說明了代理AI中的反射模式。
這些是反思模式所涉及的步驟 -
生成初始輸出
自我審查/批評輸出
確定錯誤,差距或改進領域
提出改進建議
修改/完善輸出
重複步驟2-5直到達到令人滿意的結果
立即創建新的流程圖
DeepSeek V3輸出:
--------------------------------<br> |生成初始輸出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |自我審查/批評輸出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |確定錯誤,差距或改進領域|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |提出改進建議|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |修訂/完善輸出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |結果令人滿意嗎? |<br> --------------------------------<br> |<br> -----------------------<br> | |<br> VV<br>是否<br> | |<br> VV<br> --------------------------------<br> |最終輸出|<br> --------------------------------<br> |<br> v<br> --------------------------------<br> |結束|<br> --------------------------------
GPT 4O輸出:
觀察:
GPT-4O的流程圖比DeepSeek V3更有效,因為它實現了適當的反饋循環。儘管V3的流程圖試圖根據令人滿意的結果顯示決策路徑,但它具有邏輯缺陷,其中“是”和“否”結果都會導致相同的輸出。相比之下,GPT-4O的設計正確地表明了結果不令人滿意的結果如何重新回到過程中,更好地代表了改進的迭代性質。
判決:
DeepSeek V3 | gpt 4o✅
該GPT 4O與DeepSeek V3指南的第一個任務是,我有一個網站的斑馬拼圖。
提示:解決這個斑馬難題,給我一個最終結果表。
DeepSeek V3輸出:
將此回應放在網站上:
GPT 4O輸出:
將此解決方案放在網站上:
觀察:
儘管這兩個模型都將隨機名稱分配給了無法提供信息的元素,但V3正確解決了問題,而GPT-4O未能這樣做。
判決:
DeepSeek V3 | gpt 4o❌
提示:圖顯示了電路的一部分。它由平行和串聯配置的電阻組成。找到等效電阻。
DeepSeek V3輸出:
GPT 4O響應:
觀察:
當比較給定電阻網絡的DeepSeek V3和GPT-4O的解決方案時,GPT-4O的1.29Ω計算是正確的,而DeepSeek V3的結果為3.59Ω是不正確的。 GPT-4O通過三個平行分支正確地識別了電路的結構:(R1 R2 =3Ω),R3 =3Ω和(R4 R5 =9Ω),然後準確地應用了並行電阻公式(1/RT = 1/3 1/3 1/3 1/9 = 7/9),以獲得最終結果。 DeepSeek V3通過錯誤地分組電阻,誤會列表和並行組合而犯了關鍵錯誤,從而導致其最終計算不准確。
判決:
DeepSeek V3 | gpt 4o✅
提示:閱讀文章Athttps://www.analyticsvidhya.com/blog/2024/07/building-agentic-agentic-rag-systems-with-langgraph/-了解為Wikipedia數據創建矢量數據庫的過程。然後,提供關鍵步驟的簡明摘要。
DeepSeek V3輸出:
GPT 4O輸出:
觀察:
DeepSeek V3和GPT-4O都提供了技術上合理的解釋,但是GPT-4O的響應與關於矢量db創建的原始查詢更加準確地保持一致。儘管DeepSeek V3提供了更廣泛的技術環境,涵蓋了預處理,索引和langgraph集成,但GPT-4O專門針對Chromadb實施,該實施直接解決了手頭的任務。兩種方法都有其優點,但是對於特定的問題,GPT-4O的目標響應證明更適用。
判決:
DeepSeek V3 | gpt 4o✅
提示:圖像分為幾乎相同的兩個部分。但是,左圖中有三個元素在右圖中缺少。您的任務是確定這些缺失的元素。
DeepSeek V3輸出:
GPT 4O輸出:
觀察:
V3無法直接分析圖像並提供了通用響應。 GPT-4確定了一個正確的差異,但其餘的差異是不正確的。
判決:
DeepSeek V3 | gpt 4o❌
任務 | 優勝者 |
---|---|
流程圖 | GPT-4O |
斑馬拼圖 | DeepSeek V3 |
物理電路問題 | GPT-4O |
文章摘要 | GPT-4O |
尋找差異 | 兩者都不 |
另請閱讀:
顯然,GPT-4O在上述任務中優於DeepSeek V3。但是,它在解決難題任務中的成功突出了其在該領域的特殊優勢。
話雖如此,DeepSeek V3證明,開源車型可以與GPT-4O等商業模型競爭,同時培訓的成本效益要高得多(550萬美元與1億美元)。
我真的很高興能潛入DeepSeek V3並探索其全部功能。你呢?您是否嘗試過這兩種型號?您更喜歡誰的反應?在下面的評論中分享您的想法!
從頭開始學習DeepSeek!加入我們的“入門”課程,並探索其功能以提高您的AI技能。
以上是DeepSeek V3與GPT-4O:哪個更好?的詳細內容。更多資訊請關注PHP中文網其他相關文章!