대형 모델이 수학 문제를 어떻게 풀 수 있나요? "AI 수학 올림피아드(AIMO Progress Award)의 예비 결과가 발표됐다. 리더보드 데이터에 따르면, 우승 프로그램은 현재 비공개 테스트에서 29/50 문제를 정확하게 답한 것으로 나타나 예상보다 높은 결과를 얻었다. "방금 타오저쉬안이 자신의 블로그를 통해 이 소식을 알렸습니다.
AIMO는 머신러닝 양적 거래를 전문으로 하는 비은행 금융 기관인 XTX Markets에서 시작되었습니다. 주로 참가자들이 AI 모델을 사용하여 국제 수학적 문제를 해결할 수 있도록 하는 시스템을 만드는 것입니다. LaTeX 형식으로 작성된 복잡한 수학적 문제를 해결할 수 있습니다. 이는 인공지능 모델의 수학적 추론 능력을 향상시키고, 첨단 지식 개발을 촉진하는 데 도움이 됩니다.
진행상이 수여되는 것은 이번이 처음이며 우승팀은 미화 104만 8천 달러의 상금을 두고 경쟁하게 된다는 점을 언급할 가치가 있습니다. 참가 문제에는 중학교 수학 경시대회 문제도 포함돼 있지만 난이도가 국제수학올림피아드(IMO) 수준에는 미치지 못한다. 수상 자격을 얻으려면 팀이 코드, 방법, 데이터 및 모델 매개변수를 공개적으로 공개해야 합니다.
순위에 따르면 Numina 팀이 1위, CMU_MATH 팀이 2위, 시험 후 임시 3위, Codeinter 팀과 Conor #2 팀이 각각 4위와 5위를 차지한 것을 확인할 수 있습니다. 규정에 따르면 최대 참가 팀 수는 5명이며, 상위 5명 중 2명이 싱글 플레이어이다.
Mixtral・8x7b, Gemma, Llama 3 등 모든 사람이 사용하는 모델도 다릅니다.
1. IMO 국제 수학 올림피아드는 항상 수학을 전문으로 하는 마니아들이 직접 참여해 왔습니다. 그러나 대형 모델의 역량이 계속 향상되면서 수학에서의 성과도 점점 더 주목을 받고 있습니다.
- 모든 사람의 테스트 초점은 점차 유사한 대학 입시 문제에서 올림픽 경기장으로 옮겨졌습니다. 이전에는 Google DeepMind의 AlphaGeometry가 Nature에 게재되었습니다. 이 연구는 올림픽 수준의 문제 30개 중 25개를 해결하여 국제 수학 올림피아드에 접근했습니다. . 대회 금메달리스트의 평균 성적.
- 대형 모델이 폭발적으로 증가하면서 여러 회사가 올림피아드 문제에 도전하기 시작했습니다. 서로 경쟁하면 어떤 결과가 나올까요?
- 지난 11월, AI를 위해 특별히 마련된 수학 대회에서는 미화 1,000만 달러의 상금이 수여되었습니다. 이는 국제 수학 올림피아드(IMO)에서 최고의 인간과 함께 수행할 수 있도록 개방형 인공 지능 모델의 개발을 촉진하는 것을 목표로 합니다. 뛰어난. Progress Award는 AIMO Awards의 일부로 수여됩니다. AIMO의 자문위원은 필즈상 수상자 Timothy Gowers, Terence Tao 등 모두 수학 분야의 유명 인사이며 Po-Shen Loh, Dan Roberts 및 Geoff Smith와 함께 활동하고 있습니다. 참조링크: https://aimoprize.com/participate
위 내용은 테렌스 타오가 지지합니다! AI 수학 올림피아드 발전상 발표, 상금 미화 100만 달러 이상의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!