學而思研發面向全球數學愛好者大模型MathGPT
近日,在各家大廠打得如火如荼的「ChatGPT大戰」中,學而思也加入其中。
不過,學而思另闢蹊徑選擇的是自研數學大模型“MathGPT”,以數學領域的解題和講題演算法為核心,並且已經取得了階段性成果。
對此學而思表示,基於此自研大模型的產品級應用預計會在年內推出,將面向全球數學愛好者和科研機構。
作為公司的核心項目,學而思早在今年春節之前就啟動了相應的團隊建設、數據、算力準備和技術研發,並直接交由CTO田密負責。
此外,位於美國矽谷的團隊建設目前也已經啟動,計劃成立一支海外演算法和工程團隊,在全球招募優秀的人工智慧專家加入。
MathGPT與大語言模型(LLM)的差異
#今年三月,OpenAI正式發表大語言模型GPT-4。隨後,國內百度、阿里也推出了各自的大模型產品。
然而,通用語言模型更像一個「文科生」,在語言翻譯、摘要、理解和生成等任務上有出色表現,但在數學問題的解決、講解、問答與推薦方面則有明顯不足-
「解答數學問題常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對適齡孩子的知識結構和認知層次做適配。」
對此,學而思AI團隊負責人表示,這種不足是由LLM模型的自身特徵決定的。 LLM大模型來自於海量語言文本的訓練,因此最擅長語言處理。
業界偏向基於LLM大模型做閱讀、寫作類別應用,但如果想要在數學能力上有突破,就需要研發新的大模型。
因此,學而思決心組建團隊專研MathGPT——數學領域大模型,用自己在數學和AI上的多年積累,面向全球範圍內的數學愛好者和科研機構,做好AI大模型時代的數學基礎工作。
學而思希望透過MathGPT來彌補和攻克大語言模型的三個問題:
第一,題目要解對,現在GPT結果常出現錯誤;
第二,解題步驟要穩定、清晰,現在GPT的解題步驟每次都不一樣,而且生成內容經常很冗餘;
第三,解題要講的有趣、個人化,現在GPT的解釋過於「學術」和機械,對孩子的學習經驗很不友善。
做MathGPT,學而思憑什麼
學而思作為獲國家科技部批准的「智慧教育國家新一代人工智慧開放創新平台」建設單位,也是教育界唯一一家人工智慧「國家隊」成員,在人工智慧領域有著多年的深入研究,早在2017年,學而思便成立了AI lab人工智慧實驗室。
據公開資訊顯示,基於智慧教育人工智慧開放創新平台助力,學而思AI lab獲得各類頂級學術會議比賽冠軍16項,亞軍6項;發表國際期刊和會議高層次學術論文31篇,包含光學字元辨識、圖像、自然語言處理、語音以及多模態等多領域的學術研究,在電腦視覺頂會以及自然語言頂會中均有多篇論文發表;申請專利220餘項,授權專利150餘項,軟體著作權60餘項。
學而思AI lab在各類頂尖學術會議中獲獎情況
「以數學起家」的學而思至今已有20年的數學教學經驗,累積了龐大的數學相關數據,這些數據是進行MathGPT訓練的必備物料。
另外,學而思的海外業務Think Academy在全球若干國家和地區深受數學愛好者喜歡,學而思的學生在每年的IMO和AMC等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。
所以,學而思選擇在MathGPT方向發力也順理成章。
另據了解,學而思學習機近期將會上線一款「AI助理」,涵蓋作文助理、口語助理、閱讀助手、數學助理等相關功能,該AI產品將於5月11日開啟內測。
MathGPT的挑戰與技術難題
如何運用大語言模式服務各行各業是當下社會的焦點問題。
例如在教育領域,Duolingo、Quizlet、可汗學院等產品主要和OpenAI合作,在GPT大模型上做微調和介面調用,增強原有的產品體驗。
但也有一些領域如數學、醫學等,對AI的需求是準確、清晰、具備強大的邏輯推理能力,且容錯率低,通用LLM目前的表現表現還無法在上述領域取得突破,未來是否可能取得突破尚不清楚。
以數學領域為例,目前市場上有幾個主要流派。
例如Google收購的Photomath、微軟數學、Mathway、專注數學運算的WolframAlpha等產品,主要利用非LLM的傳統AI技術加上資料庫的方式解決數學問題。
走AGI路線的公司則嘗試讓通用LLM「更懂數學」,例如GPT-4在數學任務上比之前的3.5版本表現更好,Google旗下的Minerva模型也專門針對數學問題進行調優。
學而思選擇了另一條少有人走的路,不基於現有LLM做微調和介面呼叫、不做通用LLM,而是自研基於專業領域的“數學大模型」MathGPT,致力於打造自主、穩定、永續、高品質的學習解決方案。
在大語言模型不斷進化的浪潮下,不同的技術路線選擇孰優孰劣,仍有待討論與驗證。
學而思自研獨立的MathGPT大模型是否成立,是否能夠超越通用模型在數學任務上的表現,是否更匹配不同人群的數學學習場景,這個問題還需要在創新實踐中尋找答案。
隨著整個產業的深化發展和越來越多人才參與這個領域,相信不久的將來就能看到更成熟的解決方案。
以上是學而思研發面向全球數學愛好者大模型MathGPT的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

本文介紹如何在Debian系統上自定義Apache的日誌格式。以下步驟將指導您完成配置過程:第一步:訪問Apache配置文件Debian系統的Apache主配置文件通常位於/etc/apache2/apache2.conf或/etc/apache2/httpd.conf。使用以下命令以root權限打開配置文件:sudonano/etc/apache2/apache2.conf或sudonano/etc/apache2/httpd.conf第二步:定義自定義日誌格式找到或

Tomcat日誌是診斷內存洩漏問題的關鍵。通過分析Tomcat日誌,您可以深入了解內存使用情況和垃圾回收(GC)行為,從而有效定位和解決內存洩漏。以下是如何利用Tomcat日誌排查內存洩漏:1.GC日誌分析首先,啟用詳細的GC日誌記錄。在Tomcat啟動參數中添加以下JVM選項:-XX: PrintGCDetails-XX: PrintGCDateStamps-Xloggc:gc.log這些參數會生成詳細的GC日誌(gc.log),包含GC類型、回收對像大小和時間等信息。分析gc.log

在Debian系統中,readdir函數用於讀取目錄內容,但其返回的順序並非預先定義的。要對目錄中的文件進行排序,需要先讀取所有文件,再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序:#include#include#include#include//自定義比較函數,用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

在Debian系統中,readdir系統調用用於讀取目錄內容。如果其性能表現不佳,可嘗試以下優化策略:精簡目錄文件數量:盡可能將大型目錄拆分成多個小型目錄,降低每次readdir調用處理的項目數量。啟用目錄內容緩存:構建緩存機制,定期或在目錄內容變更時更新緩存,減少對readdir的頻繁調用。內存緩存(如Memcached或Redis)或本地緩存(如文件或數據庫)均可考慮。採用高效數據結構:如果自行實現目錄遍歷,選擇更高效的數據結構(例如哈希表而非線性搜索)存儲和訪問目錄信

本文介紹如何在Debian系統中使用iptables或ufw配置防火牆規則,並利用Syslog記錄防火牆活動。方法一:使用iptablesiptables是Debian系統中功能強大的命令行防火牆工具。查看現有規則:使用以下命令查看當前的iptables規則:sudoiptables-L-n-v允許特定IP訪問:例如,允許IP地址192.168.1.100訪問80端口:sudoiptables-AINPUT-ptcp--dport80-s192.16

Debian系統中的readdir函數是用於讀取目錄內容的系統調用,常用於C語言編程。本文將介紹如何將readdir與其他工具集成,以增強其功能。方法一:C語言程序與管道結合首先,編寫一個C程序調用readdir函數並輸出結果:#include#include#includeintmain(intargc,char*argv[]){DIR*dir;structdirent*entry;if(argc!=2){

本指南將指導您學習如何在Debian系統中使用Syslog。 Syslog是Linux系統中用於記錄系統和應用程序日誌消息的關鍵服務,它幫助管理員監控和分析系統活動,從而快速識別並解決問題。一、Syslog基礎知識Syslog的核心功能包括:集中收集和管理日誌消息;支持多種日誌輸出格式和目標位置(例如文件或網絡);提供實時日誌查看和過濾功能。二、安裝和配置Syslog(使用Rsyslog)Debian系統默認使用Rsyslog。您可以通過以下命令安裝:sudoaptupdatesud

Debian系統中,Nginx的訪問日誌和錯誤日誌默認存儲位置如下:訪問日誌(accesslog):/var/log/nginx/access.log錯誤日誌(errorlog):/var/log/nginx/error.log以上路徑是標準DebianNginx安裝的默認配置。如果您在安裝過程中修改過日誌文件存放位置,請檢查您的Nginx配置文件(通常位於/etc/nginx/nginx.conf或/etc/nginx/sites-available/目錄下)。在配置文件中
