首页 科技周边 人工智能 新华社联合北大发布AI大模型评测:安全可靠成重点,360智脑表现优异

新华社联合北大发布AI大模型评测:安全可靠成重点,360智脑表现优异

Aug 14, 2023 am 11:37 AM

近日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》(以下简称“报告”)显示,当前中国大模型产品进步显着,360智脑、智谱ChatGLM等表现抢眼。其中360智脑大模型在基础能力等方面稳居大模型第一梯队。报告评价称AI大模型的发展为人类工作和生活的提质增效均带来了正向的积极影响。

据悉,此次测评特邀北京大学文化与传播研究所及其他业界、学界专家全程参与,包括基础能力、智商测试、情商测试、工具提效能力等500道题目,测评在题型数量、题型质量、专家团队等方面均有升级,更加权威客观。

新华社联合北大发布AI大模型评测:安全可靠成重点,360智脑表现优异

报告引用360智脑对部分题目的回答作为最佳案例展示,如“山西食客倒醋洗碗”等时效性问题,360智脑“展现了大模型强大的实时搜索与回复能力”。

据了解,人工智能大模型目前有两大短板,即实时性和准确性,在企业级场景中是致命缺陷。而搜索引擎可以帮助大模型进行知识更新和知识校正,解决数据滞后和幻觉等问题。 360作为国内第二大搜索引擎厂商,拥有天然的大模型技术基因和优势。

新华社联合北大发布AI大模型评测:安全可靠成重点,360智脑表现优异

报告显示,目前“大模型进程过半,AI走进千家万户成为关注重点”。 360集团创始人周鸿祎认为,大模型未来真正的发展机会在企业级市场,大模型有引领新一轮工业革命的潜质,前提是走进千家万户、赋能百业千行。据了解,360已推出企业级AI大模型解决方案,将遵循“安全、向善、可信、可控”四原则打造企业级垂直大模型,目前已经为20个行业提供解决方案。

报告同时提到“安全可靠的大模型产品应用正成为深耕方向”。据了解,大模型目前主要面临网络安全、数据安全、算法安全三大安全问题。 360拥有全球规模最大的安全大数据、世界领先的APT捕获能力,并将AI大模型安全这一世界性课题作为攻克方向。日前360发布了国内首个可交付安全行业大模型,将作为“360安全云”的重要平台和工具,为企业运营提供“安全副手”。

360智脑是360集团自研的认知型通用大模型,在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力领先。 360集团作为工信部中国电子技术标准化研究院授予的“国家人工智能标准化总体组大模型专题组”组长单位,参与大模型测试国家标准制订。

以上是新华社联合北大发布AI大模型评测:安全可靠成重点,360智脑表现优异的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
1 个月前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

我尝试了使用光标AI编码的Vibe编码,这太神奇了! 我尝试了使用光标AI编码的Vibe编码,这太神奇了! Mar 20, 2025 pm 03:34 PM

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发,这种创新的方法使Dev

2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! 2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! Mar 22, 2025 am 10:58 AM

2025年2月,Generative AI又是一个改变游戏规则的月份,为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

如何使用Yolo V12进行对象检测? 如何使用Yolo V12进行对象检测? Mar 22, 2025 am 11:07 AM

Yolo(您只看一次)一直是领先的实时对象检测框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步,可显着提高准确性

Chatgpt 4 o可用吗? Chatgpt 4 o可用吗? Mar 28, 2025 pm 05:29 PM

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

最佳AI艺术生成器(免费付款)创意项目 最佳AI艺术生成器(免费付款)创意项目 Apr 02, 2025 pm 06:10 PM

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

Google的Gencast:Gencast Mini Demo的天气预报 Google的Gencast:Gencast Mini Demo的天气预报 Mar 16, 2025 pm 01:46 PM

Google DeepMind的Gencast:天气预报的革命性AI 天气预报经历了巨大的转变,从基本观察到复杂的AI驱动预测。 Google DeepMind的Gencast,开创性

哪个AI比Chatgpt更好? 哪个AI比Chatgpt更好? Mar 18, 2025 pm 06:05 PM

本文讨论了AI模型超过Chatgpt,例如Lamda,Llama和Grok,突出了它们在准确性,理解和行业影响方面的优势。(159个字符)

O1 vs GPT-4O:OpenAI的新型号比GPT-4O好吗? O1 vs GPT-4O:OpenAI的新型号比GPT-4O好吗? Mar 16, 2025 am 11:47 AM

Openai的O1:为期12天的礼物狂欢始于他们迄今为止最强大的模型 12月的到来带来了全球放缓,世界某些地区的雪花放缓,但Openai才刚刚开始。 山姆·奥特曼(Sam Altman)和他的团队正在推出12天的礼物前

See all articles