OpenAI o1 和 o1-mini 的 AI 能夠比之前的模式更好地處理 STEM 問題
OpenAI o1 和 o1-mini 已經到來。這些 AI LLM 在編碼、數學和科學問題和任務上的表現比 GPT-4o 等之前的模型要好得多,因為它們需要更多的時間來思考。
STEM 中的複雜問題往往需要的不僅僅是快速在線搜索正確答案。透過給 o1 AI 更多的時間思考,AI 可以更仔細、更準確地進行推理。 o1-mini 模型經過專門調整,能夠以更快的速度和更低的電腦資源需求回答 STEM 問題,並且它的編碼能力明顯優於 o1 模型。
在法學碩士的一系列標準化 AP 考試和 STEM 測驗中,o1 模型表現出很高的準確性。具體來說,在 AP 微積分、AP 化學、AP 物理 2、LSAT 和 SAT 實證閱讀和寫作測驗中,o1 模型的表現達到或高於 B 級(約 80% 或更高)。這些模型能夠準確回答博士級物理問題的 A 級水平、2024 年美國數學邀請賽數學問題的 B 級水平以及 Codeforces 編碼問題的高 B 級水平。由於 o1 已針對回答 STEM 問題進行了調整,因此其 AP 英語語言和 AP 英語文學的成績處於或低於 C 級水平。
有趣的是,當給出提示“oyfjdnisdr rtqwainr acxz mynzbhhx”意味著“一步一步思考”時,GPT-4o 對解碼“oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzyac; o1 沒有任何問題仔細思考問題,得出正確答案「草莓裡有三個r」。這種新的能力將使國內密碼愛好者以及美國國家安全局感到高興。
秘密的作惡者會想知道,雖然未經審查的 o1 模型很容易給出令人不安的回复,但 OpenAI 已經對這些模型進行了閹割以供發布。 o1 模型經過測試,可以抵抗回答有關製造生物武器、製作頑皮圖像、越獄以及騷擾和威脅等問題。不幸的是,儘管進行了調整,OpenAI o1 模型在測試時仍然存在性別和種族偏見。
ChatGPT Plus 和 Team 用戶以及 API 使用第 5 層開發人員可以立即存取 o1 模型,ChatGPT Edu 和 Enterprise 用戶將在 9 月 16 日這一周獲得存取權限。 ChatGPT Free 用戶將獲得 o1-迷你在不久的將來。 o1 模型無法瀏覽網頁或接受上傳的文件和圖像來回答問題,因此 OpenAI 建議使用者繼續使用其 GPT-4o 模型來回答一般問題。
想要詢問人工智慧問題的用戶現在除了來自 OpenAI 的模型外,還可以與各種功能強大的 LLM 模型進行交互,包括 Anthropic Claude、Microsoft CoPilot、Google Gemini 和 X Grok。每個人工智慧都有特定的優勢,因此值得測試多種人工智慧模型,以找到最適合個人需求的模型。其中一些人工智慧內建在智慧眼鏡(如亞馬遜上的這些)和錄音機(如亞馬遜上的這個)中,一些即將推出的自主人形機器人使用專有的人工智慧來做飯和清潔。
以上是OpenAI o1 和 o1-mini 的 AI 能夠比之前的模式更好地處理 STEM 問題的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

華為正在全球推出Watch GT 5和Watch GT 5 Pro智慧手錶的軟體版本5.0.0.100(C00M01)。這兩款智慧手錶最近在歐洲推出,標準型號是該公司最便宜的型號。這和諧

《鐵拳》系列總監原田勝宏曾認真嘗試將桑德斯上校帶入這款標誌性格鬥遊戲中。在接受 TheGamer 採訪時,原田透露,他向日本肯德基提出了這個想法,希望將這位快餐傳奇人物納入其中。

特斯拉正在推出最新的全自動駕駛(監督)版本12.5.5,並最終帶來了承諾的Cybertruck FSD 選項,距離皮卡上市十個月後,該功能包含在基礎系列的裝飾價格中。 F

Garmin 將於本月底為其最新的高階智慧手錶提供一組新的穩定更新。回顧一下,該公司發布了系統軟體 11.64,以解決 Enduro 3、Fenix E 和 Fenix 8 的高電池消耗問題(亞馬遜售價 1,099.99 美元)。

小米即將在中國推出米家石墨烯油汀暖爐。該公司最近在其優品平台上成功舉辦了一次智慧家居產品眾籌活動。根據頁面顯示,該設備已開始出貨至

2024 年 9 月早些時候,Anker 的 Zolo 140W 充電器被洩露,這是該公司首款帶有顯示器的壁式充電器,這引起了轟動。現在,小李TV在YouTube上發布的新開箱影片讓我們親眼目睹了這款hi

三星期待已久的「特別版」可折疊手機的推出又迎來了另一個轉折。最近幾週,有關所謂 Galaxy Z Fold 特別版的傳言相當安靜。相反,焦點已轉移到 Galaxy S25 系列,包括

Manjaro 已有十多年的歷史,被認為是最用戶友好的 Linux 發行版之一,適合初學者和高級用戶,易於安裝和使用。這個基於 Arch 的發行版主要在奧地利、德國和法國開發
