首頁 硬體教學 硬體新聞 OpenAI o1 和 o1-mini 的 AI 能夠比之前的模式更好地處理 STEM 問題

OpenAI o1 和 o1-mini 的 AI 能夠比之前的模式更好地處理 STEM 問題

Sep 19, 2024 am 03:22 AM
openai laptop test Notebook review reviews tests reports netbook STEM o1 o1-mini

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 和 o1-mini 已經到來。這些 AI LLM 在編碼、數學和科學問題和任務上的表現比 GPT-4o 等之前的模型要好得多,因為它們需要更多的時間來思考。

STEM 中的複雜問題往往需要的不僅僅是快速在線搜索正確答案。透過給 o1 AI 更多的時間思考,AI 可以更仔細、更準確地進行推理。 o1-mini 模型經過專門調整,能夠以更快的速度和更低的電腦資源需求回答 STEM 問題,並且它的編碼能力明顯優於 o1 模型。

在法學碩士的一系列標準化 AP 考試和 STEM 測驗中,o1 模型表現出很高的準確性。具體來說,在 AP 微積分、AP 化學、AP 物理 2、LSAT 和 SAT 實證閱讀和寫作測驗中,o1 模型的表現達到或高於 B 級(約 80% 或更高)。這些模型能夠準確回答博士級物理問題的 A 級水平、2024 年美國數學邀請賽數學問題的 B 級水平以及 Codeforces 編碼問題的高 B 級水平。由於 o1 已針對回答 STEM 問題進行了調整,因此其 AP 英語語言和 AP 英語文學的成績處於或低於 C 級水平。

有趣的是,當給出提示“oyfjdnisdr rtqwainr acxz mynzbhhx”意味著“一步一步思考”時,GPT-4o 對解碼“oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzyac; o1 沒有任何問題仔細思考問題,得出正確答案「草莓裡有三個r」。這種新的能力將使國內密碼愛好者以及美國國家安全局感到高興。

秘密的作惡者會想知道,雖然未經審查的 o1 模型很容易給出令人不安的回复,但 OpenAI 已經對這些模型進行了閹割以供發布。 o1 模型經過測試,可以抵抗回答有關製造生物武器、製作頑皮圖像、越獄以及騷擾和威脅等問題。不幸的是,儘管進行了調整,OpenAI o1 模型在測試時仍然存在性別和種族偏見。

ChatGPT Plus 和 Team 用戶以及 API 使用第 5 層開發人員可以立即存取 o1 模型,ChatGPT Edu 和 Enterprise 用戶將在 9 月 16 日這一周獲得存取權限。 ChatGPT Free 用戶將獲得 o1-迷你在不久的將來。 o1 模型無法瀏覽網頁或接受上傳的文件和圖像來回答問題,因此 OpenAI 建議使用者繼續使用其 GPT-4o 模型來回答一般問題。

想要詢問人工智慧問題的用戶現在除了來自 OpenAI 的模型外,還可以與各種功能強大的 LLM 模型進行交互,包括 Anthropic Claude、Microsoft CoPilot、Google Gemini 和 X Grok。每個人工智慧都有特定的優勢,因此值得測試多種人工智慧模型,以找到最適合個人需求的模型。其中一些人工智慧內建在智慧眼鏡(如亞馬遜上的這些)和錄音機(如亞馬遜上的這個)中,一些即將推出的自主人形機器人使用專有的人工智慧來做飯和清潔。

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

OpenAI o1 and o1-mini arrive as AIs that handle STEM questions better than prior models

以上是OpenAI o1 和 o1-mini 的 AI 能夠比之前的模式更好地處理 STEM 問題的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1318
25
PHP教程
1269
29
C# 教程
1248
24
華為Watch GT 5智慧手錶獲得新功能更新 華為Watch GT 5智慧手錶獲得新功能更新 Oct 03, 2024 am 06:25 AM

華為正在全球推出Watch GT 5和Watch GT 5 Pro智慧手錶的軟體版本5.0.0.100(C00M01)。這兩款智慧手錶最近在歐洲推出,標準型號是該公司最便宜的型號。這和諧

鐵拳桑德斯上校的夢想被肯德基炸了 鐵拳桑德斯上校的夢想被肯德基炸了 Oct 02, 2024 am 06:07 AM

《鐵拳》系列總監原田勝宏曾認真嘗試將桑德斯上校帶入這款標誌性格鬥遊戲中。在接受 TheGamer 採訪時,原田透露,他向日本肯德基提出了這個想法,希望將這位快餐傳奇人物納入其中。

Cyber​​truck FSD 評論稱讚快速車道切換和全螢幕視覺化 Cyber​​truck FSD 評論稱讚快速車道切換和全螢幕視覺化 Oct 01, 2024 am 06:16 AM

特斯拉正在推出最新的全自動駕駛(監督)版本12.5.5,並最終帶來了承諾的Cyber​​truck FSD 選項,距離皮卡上市十個月後,該功能包含在基礎系列的裝飾價格中。 F

Garmin 透過新的更新發布了針對多款智慧手錶的冒險賽車活動改進 Garmin 透過新的更新發布了針對多款智慧手錶的冒險賽車活動改進 Oct 01, 2024 am 06:40 AM

Garmin 將於本月底為其最新的高階智慧手錶提供一組新的穩定更新。回顧一下,該公司發布了系統軟體 11.64,以解決 Enduro 3、Fenix E 和 Fenix 8 的高電池消耗問題(亞馬遜售價 1,099.99 美元)。

搭載 HyperOS 的新款小米米家石墨烯油汀到貨 搭載 HyperOS 的新款小米米家石墨烯油汀到貨 Oct 02, 2024 pm 09:02 PM

小米即將在中國推出米家石墨烯油汀暖爐。該公司最近在其優品平台上成功舉辦了一次智慧家居產品眾籌活動。根據頁面顯示,該設備已開始出貨至

第一眼:即將推出的 Anker Zolo 4 連接埠 140W 帶顯示壁式充電器的拆箱視訊洩露 第一眼:即將推出的 Anker Zolo 4 連接埠 140W 帶顯示壁式充電器的拆箱視訊洩露 Oct 01, 2024 am 06:32 AM

2024 年 9 月早些時候,Anker 的 Zolo 140W 充電器被洩露,這是該公司首款帶有顯示器的壁式充電器,這引起了轟動。現在,小李TV在YouTube上發布的新開箱影片讓我們親眼目睹了這款hi

三星 Galaxy Z Fold 特別版透露將於 10 月底登陸,但名稱出現衝突 三星 Galaxy Z Fold 特別版透露將於 10 月底登陸,但名稱出現衝突 Oct 01, 2024 am 06:21 AM

三星期待已久的「特別版」可折疊手機的推出又迎來了另一個轉折。最近幾週,有關所謂 Galaxy Z Fold 特別版的傳言相當安靜。相反,焦點已轉移到 Galaxy S25 系列,包括

Manjaro 24.1「Xahea」與 KDE Plasma 6.1.5、VirtualBox 7.1 等一起發布 Manjaro 24.1「Xahea」與 KDE Plasma 6.1.5、VirtualBox 7.1 等一起發布 Oct 02, 2024 am 06:06 AM

Manjaro 已有十多年的歷史,被認為是最用戶友好的 Linux 發行版之一,適合初學者和高級用戶,易於安裝和使用。這個基於 Arch 的發行版主要在奧地利、德國和法國開發

See all articles