AI幾秒鐘內解決大學數學問題,拿到80%多準確率,還擔任出題老師
或許,你做的數學考題,是機器生成的。
#MIT 的學生可以不費吹灰之力就能解決多元微積分、微分方程、線性代數等數學課題,但這些卻把機器學習模型給難倒了。因為機器學習模型只能回答小學或高中程度的數學問題,而且它們並不總是能找到正確答案。
現在,來自MIT、哥倫比亞大學、哈佛大學和滑鐵盧大學的研究者,他們使用小樣本學習、OpenAI 的Codex 來自動合成程序,在幾秒鐘內解決了大學數學問題,達到了人類水準。這項研究發表在《美國國家科學院院刊》(PNAS)。
此外,模型對產生的解決方案還能進行解釋,並能快速產生新的大學數學問題。當研究人員向學生展示這些機器產生的問題時,學生甚至無法判斷這些問題是由演算法產生的還是由人類產生的。
這項研究也可以用來簡化課程內容生成,這對擁有數千名學生的學校和大型開放式網路課程(MOOC)尤其有用。該系統還可以充當線上導師,向學生展示解決數學問題的步驟。
#論文網址:https://www.pnas.org/doi/epdf/10.1073/pnas.2123433119
該研究的方法結合了三個創新:
- #與只在文本上進行預訓練不同,該研究在文字上進行預訓練的同時,還在程式碼上進行微調;
- 採用小樣本學習合成程式能夠正確解決數學問題;
- 該研究能夠解決問題、解釋解決方案以及產生新問題。
該研究產生新問題範例如下。
能答題、解題、出題的模型
研究團隊已經為這個專案花費了近兩年時間。他們發現,僅使用文字進行預訓練的模型,在高中數學問題上的準確率不會超過8%,而使用圖神經網路模型,可以在機器學習課程問題上做得很好,但需要一周的時間來訓練。研究從七門課程中隨機抽取25 個問題:MIT 的18.01 單變量微積分、18.02 多變量微積分、18.03 微分方程、18.05 機率與統計概論、18.06線性代數、6.042 計算機科學數學和哥倫比亞大學的COMS3251 計算線性代數。
對於MATH 資料集,研究從資料集中的六個主題(代數、計數與機率、中級代數、數論、初級代數和微積分)中隨機抽取15 個問題。
在將這些程式設計任務輸入到神經網路之前,研究人員新增了一個新步驟,使其能夠大大優於以前的嘗試。
與 GPT-3 等網路只在文字上進行預訓練不同。他們把這些問題轉化為程式設計任務,並應用程式合成和小樣本學習技術。把數學問題變成程式設計任務,就像可以簡單地把求兩點之間的距離這個問題改寫為寫一個程式來求兩點之間的差。
值得一提的是該研究不僅對 Codex 進行了文本上的預訓練,還在程式碼上進行了微調,使得其可以產生大規模解決數學問題的程式。
預訓練模型顯示了來自線上儲存庫的數百萬個程式碼範例。由於模型的訓練資料包括數百萬自然語言單字和數百萬行程式碼,因此它可以學習文字片段和程式碼片段之間的關係。
如下圖所示研究使用零樣本和小樣本學習來自動產生程序,該程序可以解決 81% 數學問題。然後他們使用 Codex 來解釋產生的程式。產生的程式可以輸出多種形式的答案。例如計算和描繪奇異值分解(SVD)的幾何形狀,不光給出正確答案,還能給出對應的解釋! 應用神經網路 OpenAI Codex 來解決、解釋和產生數學問題。
#論文作者之一Drori 解釋說,許多數學問題可以用圖或樹來解決,但很難將文本編寫的問題轉化為這種表示形式。但是,由於模型已經學習了文字和程式碼之間的關係,因此它可以將文字問題轉換為程式碼,只需給出幾個問題程式碼範例,然後運行程式碼就可以來回答問題。
「當你只使用文字提出問題時,機器學習模型很難給出答案,即使答案可能在文本中,這項工作填補了程式碼和程式合成中缺少的部分。」Drori 說。
Drori 也補充說,這項工作是第一次解決本科數學問題,並將準確率從 8% 提高到 80% 以上。
新增上下文
其實將數學問題轉換為程式設計任務並不總是那麼簡單。有些問題需要研究人員添加上下文,以便神經網路能夠正確處理問題。一個學生在學習這門課程時會了解這種背景知識,但除非研究人員明確說明,否則神經網路不具備這種背景知識。
例如,他們需要說明文字中的網路指的是神經網路而不是通訊網路。或者他們可能需要告訴模型使用哪個程式包。他們可能還需要提供某些定義,例如在關於撲克牌的問題中,他們可能需要告訴模型每副牌包含 52 張牌。
該研究會自動將這些程式設計任務以及包含的上下文和範例輸入到經過預訓練和微調的神經網絡,該神經網路會輸出一個通常能產生正確答案的程序。 80% 以上的問題都是正確的。
研究人員也使用他們的模型來產生問題,透過給神經網路一系列關於某個主題的數學問題,然後讓它創建一個新的問題。例如,有關於水平線和垂直線的量子檢測問題,它產生了關於對角線量子檢測的新問題。因此,它不僅僅是透過替換現有問題中的值和變數來產生新問題。
人類提出的問題與機器生成的問題
研究人員透過向大學生展示機器生成的問題來測試這些問題。研究人員隨機給學生 10 道來自本科數學課程的問題;其中 5 個是由人類創造的,5 個是由機器產生的。
學生無法判斷機器生成的問題是由演算法還是由人工生成的,他們對課程的難度和適當性給予了類似的評分。
不過,Drori 指出這項工作並不是為了取代人類教授。
「現在準確率已經達到80%,但不會達到100%。每當你解決了一個問題,就會有人提出一個更難的問題。但這項工作為人們開始用機器學習解決越來越難的問題開闢了領域。我們認為這將對高等教育產生巨大影響。」Drori 表示。
研究團隊對他們方法的成功感到興奮,並將工作擴展到處理數學證明上,同時他們還計劃解決一些限制,目前,該模型無法使用視覺化組件回答問題,也無法解決由於計算複雜度而難以計算的問題。
除了克服這些障礙外,該研究還致力於將模型擴展到數百門課程。有了這些課程,他們將產生更多的數據,以提高自動化程度,並提供對課程設計和課程的見解。
以上是AI幾秒鐘內解決大學數學問題,拿到80%多準確率,還擔任出題老師的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。

目前排名前十的虛擬幣交易所:1.幣安,2. OKX,3. Gate.io,4。幣庫,5。海妖,6。火幣全球站,7.拜比特,8.庫幣,9.比特幣,10。比特戳。

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易
