首頁 科技週邊 人工智慧 千億規模參數,阿里雲通義千問進化到2.0:性能超GPT-3.5,加速追趕GPT-4

千億規模參數,阿里雲通義千問進化到2.0:性能超GPT-3.5,加速追趕GPT-4

Oct 31, 2023 pm 06:17 PM
入門 千億參數 通義千問2.0

阿里云于10月31日正式发布了千亿级参数大模型通义千问2.0。根据10个权威测评结果显示,通义千问2.0的综合性能超过了GPT-3.5,并且正在快速迎头赶上GPT-4。当天,通义千问APP在各大手机应用市场上线,任何人都可以通过该APP直接体验最新模型的能力

过去 6 个月,通义千问 2.0 在性能上取得巨大飞跃,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过 GPT-3.5,加速追赶 GPT-4。

千億規模參數,阿里雲通義千問進化到2.0:性能超GPT-3.5,加速追趕GPT-4

通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小

中英文理解能力是大语言模型的基本功。英语任务方面,通义千问 2.0 在 MMLU 基准的得分是 82.5,仅次于 GPT-4,通过大幅增加参数量,通义千问 2.0 能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问 2.0 以明显优势在 C-Eval 基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。

在数学推理、代码理解等领域,通义千问 2.0 进步明显。在推理基准测试 GSM8K 中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在 HumanEval 测试中,通义千问得分紧跟 GPT-4 和 GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

千億規模參數,阿里雲通義千問進化到2.0:性能超GPT-3.5,加速追趕GPT-4

通义千问 2.0 发布

通义千问更成熟了,也更好用了。通义千问 2.0 在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。

与此同时,基于通义大模型训练的 8 大行业模型组团上线,他们分别是通义灵码 - 智能编码助手、通义智文 - AI 阅读助手、通义听悟 - 工作学习 AI 助手、通义星尘 - 个性化角色创作平台、通义点金 - 智能投研助手、通义晓蜜 - 智能客服、通义仁心 - 个人专属健康助手、通义法睿 - AI 法律顾问。8 大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK 调用等方式,将模型能力集成到自己的大模型应用和服务中。

千億規模參數,阿里雲通義千問進化到2.0:性能超GPT-3.5,加速追趕GPT-4

通义大模型家族全面升级,8 大行业模型组团上线

截至到10月份,阿里云已经与60多个行业的领军伙伴开展了深度合作,推动通用千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的实际应用

周靖人表示,阿里云计划在不久的将来开源通义千问的72B版本。此前,阿里云已经先后开源了7B和14B版本的模型,这些模型的累计下载量已经超过100万。阿里云将继续支持各行业的开发者利用通义千问开源模型进行模型和应用的创新

千億規模參數,阿里雲通義千問進化到2.0:性能超GPT-3.5,加速追趕GPT-4

通义千问 72B 即将开源

以上是千億規模參數,阿里雲通義千問進化到2.0:性能超GPT-3.5,加速追趕GPT-4的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
2 週前 By 尊渡假赌尊渡假赌尊渡假赌
倉庫:如何復興隊友
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

值得你花時間看的擴散模型教程,來自普渡大學 值得你花時間看的擴散模型教程,來自普渡大學 Apr 07, 2024 am 09:01 AM

值得你花時間看的擴散模型教程,來自普渡大學

一鍵生成PPT! Kimi :讓「PPT民工」先浪起來 一鍵生成PPT! Kimi :讓「PPT民工」先浪起來 Aug 01, 2024 pm 03:28 PM

一鍵生成PPT! Kimi :讓「PPT民工」先浪起來

CVPR 2024全部獎項公佈!近萬人線下參會,Google華人研究員獲最佳論文獎 CVPR 2024全部獎項公佈!近萬人線下參會,Google華人研究員獲最佳論文獎 Jun 20, 2024 pm 05:43 PM

CVPR 2024全部獎項公佈!近萬人線下參會,Google華人研究員獲最佳論文獎

入門學習C語言的五款程式設計軟體 入門學習C語言的五款程式設計軟體 Feb 19, 2024 pm 04:51 PM

入門學習C語言的五款程式設計軟體

PyCharm社群版安裝指南:快速掌握全部步驟 PyCharm社群版安裝指南:快速掌握全部步驟 Jan 27, 2024 am 09:10 AM

PyCharm社群版安裝指南:快速掌握全部步驟

技術入門者必看:C語言和Python難易度解析 技術入門者必看:C語言和Python難易度解析 Mar 22, 2024 am 10:21 AM

技術入門者必看:C語言和Python難易度解析

從裸機到700億參數大模型,這裡有一個教程,還有現成可用的腳本 從裸機到700億參數大模型,這裡有一個教程,還有現成可用的腳本 Jul 24, 2024 pm 08:13 PM

從裸機到700億參數大模型,這裡有一個教程,還有現成可用的腳本

細數RAG的12個痛點,英偉達高級架構師親授解決方案 細數RAG的12個痛點,英偉達高級架構師親授解決方案 Jul 11, 2024 pm 01:53 PM

細數RAG的12個痛點,英偉達高級架構師親授解決方案

See all articles