阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4
10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。 在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。
过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显着提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。
图:通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4
在MMLU、C-Eval、GSM8K 、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。
中英文理解能力是大语言模型的基本功。 英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。
图:通义千问2.0发布
通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。 通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、 通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、 通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。 8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
图:通义大模型家族全面升级,8大行业模型组团上线
截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。
图:通义千问72B即将开源
以上是阿里云发布通用问答2.0,性能超越GPT-3.5,加速追赶GPT-4的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

本站8月5日消息,阿里云宣布,2024云栖大会将于9月19日~21日在杭州云栖小镇举办,将设三日主论坛、400场分论坛与并行话题以及近四万平方米展区。云栖大会对公众免费开放,即日起公众可以通过云栖大会官网免费申请畅享票,另有5000元的全通票可购买,本站附门票网址:https://yunqi.aliyun.com/2024/ticket-list据介绍,云栖大会起源于2009年,最初命名为第一届中国网站发展论坛,2011年演变成阿里云开发者大会,2015年正式更名为“云栖大会”,至今已连续成功举

阿里云今天宣布了一个开源项目,名为Qwen-14B,该项目包括一个参数模型和一个对话模型。这个开源项目允许免费商用本站声明:阿里云之前已经开源了一个价值70亿的参数模型Qwen-7B,一个多月的下载量已经突破了100万次通过阿里云给出的数据来看,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。据介绍,Qwen-14B是一款高性能的开源模型,支持多种语言。它的整体训练数据超过3万亿Token,具备更强的推理、认知、规划和记忆能力,并且最大支持8k的上下文窗口

11月7日消息,阿里云旗下通义千问App近期登陆苹果AppStore,为苹果用户提供了一款崭新的应用选择。该应用的安装包大小为25.9MB,之前已经在多个安卓应用市场上线。通义千问是一个功能强大的超大规模预训练模型,可在创意文案、办公助手、学习辅助和趣味生活等多个领域为用户提供全方位的协助。根据应用简介,该应用的功能包括:在创意文案领域,用户可以生成小红书文案、创建剧本,以及进行改写和润色等操作办公助手功能可以生成代码,解释代码,并扩展周报等。学习助手具备中英互译、数学题解答以及文言文翻译等多项

阿里云缓存机制有阿里云Redis、阿里云Memcache、分布式缓存服务DSC、阿里云Table Store、CDN等。详细介绍:1、阿里云Redis:阿里云提供的分布式内存数据库,支持高速读写和数据持久化。通过将数据存储在内存中,可以提供低延迟的数据访问和高并发的处理能力;2、阿里云Memcache:阿里云提供的高速缓存系统等等。

Maven阿里云镜像配置详解Maven是Java项目管理工具,通过配置Maven可以方便地下载依赖库和构建项目。而阿里云镜像可以加速Maven的下载速度,提高项目构建效率。本文将详细介绍如何配置阿里云镜像,并提供具体的代码示例。什么是阿里云镜像?阿里云镜像是阿里云提供的Maven镜像服务,通过使用阿里云镜像,可以将下载Maven依赖库的速度大大加快。阿里云镜

本站11月8日消息,阿里云今日发布声明称,有自媒体发表标题为《阿里「师太」郑俊芳将去职阿里云执行董事、总经理》的文章,该文内容纯属捏造,严重失实。阿里云对相关自媒体保留追究法律责任的权利。从阿里云官方晒出的截图来看,这篇文章来自“豹变”。截至本站发稿,该文章还未删除。该文章称“郑俊芳后续或将逐步退休,陆续卸任云智能集团首席风险官兼首席财务官,不再具体管业务”。公开资料显示,郑俊芳是现任阿里合伙人、阿里巴巴集团首席风险官、云智能集团董事,兼任集团CCO,集团客户体验事业群负责人。她于今年9月任阿里

今天,北京金山办公软件股份有限公司(简称“金山办公”)与阿里云达成战略合作,双方将发挥各自的技术优势和平台能力,在云资源、AI大模型、产品生态融合、联合解决方案等多个领域展开深度合作,实现生态协同发展。金山办公CEO章庆元,中国工程院院士、阿里云创始人王坚见证签约。金山办公高级副总裁姜志强,阿里云智能集团全球商业副总裁张涛代表双方签署合作协议。金山办公是国内领先的办公软件服务提供商,为全球220多个国家和地区的用户提供办公服务。为推进双方技术合作和生态协同,打造更好的智能办公应用,为用户提供更为

阿里云Win服务器如何配置才能支持PHP运行?随着Web应用程序的兴起,PHP作为一种流行的服务器端脚本语言被广泛应用。在阿里云的Windows服务器上搭建PHP环境并使其运行,是许多开发者和管理员面临的挑战之一。本文将详细介绍如何在阿里云的Windows服务器上配置PHP环境,使其能够顺利运行。首先,确保你已经在阿里云上购买了Windows服务器,并已连接
