云从AI大模型参战!支持图文跨模态理解,跟GPT-4拼做中考题
智东西
作者 | ZeR0
编辑 | 漠影
智东西5月18日报道,今日,云从科技推出从容大模型,并现场演示了从容大模型在问答、写命题作文、意图理解、多轮对话、英文写作、机器翻译、编程、图文跨模态理解、做中考真题等方面的能力。目前从容大模型处于内测阶段。
根据演示,从容大模型对一本预先上传好的大约有五六百页的《大话西方艺术史》书籍进行了深度理解,包括询问书籍相关内容、总结这是一本什么样的书、找到指定要求的图等。
经过对从容大模型、ChatGPT、GPT-4做去年中考真题的能力进行测试,云从从容比ChatGPT的答题速度更快,答历史、生物题的得分略低于ChatGPT,答地理题的得分与ChatGPT持平,答政治题、道德与法制题的表现比ChatGPT更好。目前GPT-4.0的水平明显优于其他系统。
现场,大模型信创生态联盟正式成立,成员包括优刻得、厦门文旅、华为昇腾、南沙公控、CSDN、众数信科等,旨在促进大模型技术的创新和发展,推动人工智能在各个行业应用。
云从科技也将分别与中国中检、神舟信息、深圳报业、佳都科技、金世缘、游族网络、艾登科技合作,推出质量大模型、金融大模型、文娱大模型、交通大模型、制造大模型、游戏大模型、医疗大模型等。
一、基础能力演示:支持图文跨模态理解,做中考题速度比ChatGPT快
从容大模型的对话界面跟ChatGPT差不多。叶懋,云从科技技术管理部总监,在现场展示了从容大模型的基础能力。
问答方面,从容大模型的回复风格偏简洁、实在,能够避开一些陷阱题挖的坑。
写作方面,针对去年四川省的一个中考作文题“以最美的颜色为题写一篇不少于600字的作文”,从容大模型现场写出一篇作文。向它提出更多修改或限定要求,比如用白色改写、要求更有深度、改成以一个患病小孩的视角写最美的颜色来自于医护人员的白大褂等等之后,从容大模型能够理解意图并展现出多轮对话的能力。
在从容大模型的现场,我成功完成了一篇英文招领启事的创作,并按照要求对落款进行了修改。要求它翻译成中文后,它首先给出的回复是偏生硬的直译,接着按照“用中文习惯改写”的新要求改写了这篇启事。
编程方面,从容大模型先展示了写代码的能力,写出一段快速排序的代码。
向它提出相对专业些的话题,“这段代码的时间复杂度是多少”,从容大模型的回复没什么毛病。
要求加上代码注释,它也能快速完成。
再提高点难度,让它写出C++程序员能看懂的代码,它不仅完成了任务,还按照前面的要求添加有注释。
阅读理解方面,从容大模型支持对长文档或者多文档聚合进行理解,并支持图文跨模态理解。
云从技术人员预先上传了一本大概有五六百页的《大话西方艺术史》书籍,从容大模型对这本书的内容进行了深度理解,接着就能基于这本书所涉及的知识范畴与用户进行互动,包括询问书籍相关内容、总结这是一本什么样的书等。
如下图所示,界面中间部分是书籍的正文,右边是对话交互界面,从容大模型准备了一些提问样例,点击某个样例后,它就会实时生成回复,并附有回复内容相关的一些线索。点击这些线索就会链接到书中对应的段落位置。通过从容大模型,用户可以提供图片描述并在书籍中快速定位。
云从科技对从容大模型、ChatGPT和GPT-4进行了测试,以确定它们在2022年各学科中考真题解题方面的能力。
从测试结果来看,云从从容比ChatGPT的答题速度更快,答历史、生物题的得分略低于ChatGPT,答地理题的得分与ChatGPT持平,答政治题、道德与法制题的表现比ChatGPT更好。目前GPT-4.0的水平明显优于其他系统。
二、行业应用示例:城运治理、设备维修、金融运营、政策解答
要让从容基础大模型真正用起来,需要构建行业大模型。
云从科技联合创始人、广东公司总经理姚志强分享了从容大模型在基层治理场景的应用,比如面向民众服务的一语智办、面向公务员及网格队伍的智治精灵、面向应用开发者的编程助手、面向城运治理中心的融合指挥。
在城市运营治理中心的场景中,大屏幕播放了城市运营智能大屏幕AI助手的演示。如果一个指挥员命令“将第五屏幕移至中间”,那么AI会理解这个命令,并且迅速执行。
指挥员又提问“这个周边人和车多吗”,AI大模型随即借助多模态能力,自动分析人流车况,选取周边人和车最多的几路视频画面,并告知“依据视频内容,湖泊周边交通状态良好,但存在车辆占道违停现象,同时部分位置人员较为拥挤,建议安排安保人员维持秩序”。
指挥员继续提问:“今天对市民游玩有什么建议?”AI大模型回复了天气状况,并给出“适合出游”、“做好防晒”的建议。
面向设备维修管理场景的例子,是云从科技基于行业大模型做的智能维修伴随系统。
维修计划有两个来源:一是基于设备分类,设备历史的维修记录以及最近的生产计划等会综合自动形成一个维检修计划;二是巡检机器人或探头会在机器人巡检过程中发现某地方有个问题,这个问题可能是临时性的,它会知道有什么故障、可能性是什么、是否需要发送一个维修请求。
在准备维修的过程中,通过研究维修手册、维修记录以及专家建议,大型机器逐渐发展成为具备“老师傅”级别的维修技能。在维修前,系统会提供一个包括图文、音视频、维修关键要点的完整预习课程,方便维修工程师预习要维修的设备可能是什么故障、故障是由什么导致的、应该带什么工具、采用什么修、换什么备件等等。
在维修过程中,云从智能维修伴随系统提供两个典型的解决方案:一是“指导”,工程师可以问大模型设备故障应该怎么修;二是“监督”,大模型可以监测工程师的维修动作是否规范、有没有遗漏重要修程。
在维修工单关闭时,无需工人自己写,系统会根据全程的视频记录自动解析,形成一个图文的维修记录,并伴有这次维修中的核心视频内容,以便进行维修复盘和对后续维修提供知识源。
面向金融场景,大模型能够提升银行内部的业务运营效率。从容大模型可将银行海量的数据资源,转化为更有价值的信息,突破了专业知识的供给瓶颈,有助于提升银行在普惠金融、银行运营能力、服务实体经济方面的能力。现场演示了AI虚拟客户经理回答理财相关专业问题的表现。
相比通用大模型,用本地知识库进行优化的行业大模型能够提供更专业严谨的回答,避免出现胡编乱造的情况。
以海关政策AI精灵为例,海关政策AI精灵基于海关总署2000多份材料,形成本地的知识库,通过语义分割、语义检索、prompt learning等技术,为从容大模型构造了精准的提示词,进而能够充分发挥大模型的能力,为用户提供准确的政策解答。
云从科技内部还孵化了若干大模型应用创业项目,比如大麦数字人直播平台能够实现直播间智能搭建、直播预热语料提供等功能。
面向教育场景,智能教育AI精灵能够基于现有课程教纲、题库等基础模型,形成自生题库,根据学生平时表现生成定制习题及学习计划,并能够通过学生表现自动生成对应的综合评价分析,减少老师日常工作负担。
结语:未来几年,技术会不断解锁场景
在展示出语言、数学、推理等基础通识能力后,大模型正在走向行业,展现出在金融、法律、医学、政策等专业知识领域的应用潜能。
周曦,云从科技的董事长和总经理,认为大型模型将会颠覆传统的交互方式,并主要通过三种形式展现:问答、伴随和托管。其中,“问答”即当前的GPT;“伴随”即AI会像一个朋友一样,伴随你执行很多的事情;“托管”即一件事主要交给AI来做,类似在网游中的“挂机训练”。一旦达到“托管”阶段,人们就能够腾出手来,从而去做更有意义且更感兴趣的事情。
他谈道,有了整个平台框架,通过基础大模型构造了基础能力后,可以不断增加行业大模型的技能包,那么就能构造出更加强大的行业系统。这个系统可服务于To G、To B、To C的各行各业。
在周曦看来,没有强大的基础大模型,直接做行业大模型,不具有长期持续的生命力,因为要想让行业大模型足够实用,需要反过来训练基础大模型,如果想要让行业大模型真正在产业上量产使用,必须将效率和成本控制做到极致,而极致优化必须要掌握基础大模型。
未来产业的发展取决于不断涌现的技术突破,而行业应用不单纯依赖于创意,而是需要技术加持。在未来的几年里,技术将不断开拓新的应用场景,同时场景方也将不断尝试重构行业效率和体验。
以上是云从AI大模型参战!支持图文跨模态理解,跟GPT-4拼做中考题的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

本站6月27日消息,剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件,依托于抖音平台且基本面向该平台用户制作短视频内容,并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级,推出全新SVIP,包含多种AI黑科技,例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面,剪映SVIP月费79元,年费599元(本站注:折合每月49.9元),连续包月则为59元每月,连续包年为499元每年(折合每月41.6元)。此外,剪映官方还表示,为提升用户体验,向已订阅了原版VIP

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示:“过去的一年,我们持续推进腾讯混元大模型的能力爬坡,在丰富、海量的业务场景中打磨技术,同时洞察用户的真实需求

通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应

大型语言模型(LLM)是在巨大的文本数据库上训练的,在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时,模型实际上停止学习。对模型进行对齐或进行指令调优,让模型学习如何充分利用这些知识,以及如何更自然地响应用户的问题。但是有时模型知识是不够的,尽管模型可以通过RAG访问外部内容,但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的实际知识并将其整合

本站7月31日消息,科技巨头亚马逊于周二在美国特拉华州联邦法院起诉了芬兰电信公司诺基亚,指控其侵犯了亚马逊十几项与云计算技术相关的专利。1.亚马逊在诉讼中表示,诺基亚滥用了亚马逊云计算服务(AWS)的相关技术,包括云计算基础设施、安全和性能方面的技术,来加强其自身的云服务产品。诉状称,亚马逊于2006年推出了AWS,其开创性的云计算技术早在2000年代初期就开始研发。“亚马逊是云计算领域的先驱,现在诺基亚却在未经许可的情况下使用亚马逊的专利云计算创新成果,”诉状中写道。亚马逊要求法院发布禁令,阻

一、背景简介首先来介绍一下云问科技的发展历程。云问科技公...2023年,正是大模型盛行的时期,很多企业认为已经大模型之后图谱的重要性大大降低了,之前研究的预置的信息化系统也都不重要了。不过随着RAG的推广、数据治理的盛行,我们发现更高效的数据治理和高质量的数据是提升私有化大模型效果的重要前提,因此越来越多的企业开始重视知识建设的相关内容。这也推动了知识的构建和加工开始向更高水平发展,其中有很多技巧和方法可以挖掘。可见一个新技术的出现,并不是将所有的旧技术打败,也有可能将新技术和旧技术相互融合后

6月13日消息,据字节旗下“火山引擎”公众号介绍,小米旗下人工智能助手“小爱同学”与火山引擎达成合作,双方基于豆包大模型实现更智能的AI交互体验。据悉,字节跳动打造的豆包大模型,每日能够高效处理数量多达1200亿个的文本tokens、生成3000万张内容。小米借助豆包大模型提升自身模型的学习与推理能力,打造出全新的“小爱同学”,不仅更加精准地把握用户需求,还以更快的响应速度和更全面的内容服务。例如,当用户询问复杂的科学概念时,&ldq

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答
