用飞桨一站式搞定大模型生产 PaddleFleetX大模型开发套件业内首发
11月30日,由深度学习技术及应用国家工程研究中心主办、百度飞桨承办的WAVE SUMMIT+2022深度学习开发者峰会如期举行。峰会上,百度AI技术生态总经理马艳军发布了飞桨深度学习平台的最新技术和生态进展,全新发布飞桨开源框架2.4版本,带来业界首个端到端大模型开发套件PaddleFleetX,联合12家硬件生态伙伴发布飞桨生态发行版,AI Studio学习与实训社区升级推出企业实训和生态异构算力中心等等。这一系列举措标志着飞桨持续夯实AI技术基座,不断深入产业融合创新。
图:百度AI技术生态总经理马艳军分享飞桨平台最新发布
飞桨开源框架2.4版发布,以底层技术创新持续优化性能表现
此次飞桨升级的2.4版本,框架开发更加灵活便捷,大规模模型分布式训练持续领先,并实现了全场景高性能推理部署。
开发方面,飞桨开源框架2.4版本针对稀疏计算、图学习等重要场景新增160多个API,并且API开发门槛和成本大幅降低,使此次新增的API中有1/3来自生态开发者的贡献。针对AI for Science场景需求,2.4版实现了通用的高阶自动微分功能,更好地支持科学计算相关应用。同时,飞桨全面提升了核心动转静技术的可扩展性和部署灵活性,新模型动转静成功率达92%,充分发挥动态图和静态图各自优势。
训练方面,2.4版全新升级,推出了基于GPU的超大规模图模型训练引擎PGLBox,在业内率先实现了可同时支持复杂算法、超大图、超大离散模型的一体化图学习方案。另外,飞桨的集合通信分布式训练性能也做到了极致优化,为大模型训练提供了全面丰富的分布式训练性能优化体系,基于此,飞桨今年连续两次获得国际权威的AI训练基准测试MLPerf Training榜单第一。
作为AI实现产业落地的“最后一公里”,模型的推理部署过程十分关键。首先对于大模型的推理,飞桨开源框架2.4版支持自适应模型切分和分布式推理等功能,依托飞桨框架动转静能力,可实现自动深度融合及高性能优化,全面支撑大模型应用落地。同时为了从根本上解决AI应用落地面临的场景碎片化、开发成本高、推理速度慢三大难题,飞桨全新推出的全场景高性能AI部署工具FastDeploy,一站式满足端、边、云多场景,多框架与多硬件的部署需求,不仅API设计统一,简单易用,而且还支持自动化压缩与高性能推理引擎深度联动,可充分发挥软硬一体融合优势,拥有业内领先的推理性能,为AI产业应用落地提供最优解。
持续降低应用门槛,加速AI应用落地
大模型的应用可以降低AI应用的门槛,但大模型开发、训练、推理部署过程仍具有很大的挑战。为了更好地支撑大模型应用落地,飞桨全新发布端到端大模型开发套件PaddleFleetX。PaddleFleetX无缝对接飞桨并行策略并支持定制化组合,可以扩展支持更多类型的大模型,开发者可以根据模型结构的特点自行选择并行策略组合,并且支持GPU/NPU/DCU等多硬件平台的多云环境的训练调试。同时,PaddleFleetX还支持自适应分布式推理技术,真正做到了分布式策略的训推一体,大可支持超大模型的服务化部署,小可协同训压推结合的丰富小型化策略,实现端侧轻量化部署。
此次峰会上,飞桨产业级开源模型库开源算法新增至600个以上,覆盖视觉、自然语言、时序建模等主流任务场景;经过产业实践打磨的精度与性能平衡PP系列特色模型新增至42个;飞桨产业实践范例增至68个,覆盖金融、工业、交通、互联网、安防、教育等十个重点行业场景;发布飞桨产业级模型库一站式入口,聚合模型知识与工具集,打通模型选择、快速体验、模型开发与使用、模型部署全流程。飞桨从产业模型开源、范例参考等方面蓄力,为企业应用AI技术提供便利支持,共同解决产业痛点难点。
携手各领域生态伙伴共创共享,共同打造繁荣飞桨AI生态
推动人工智能在产业中落地应用,离不开与硬件生态伙伴的携手前行。今年5月,飞桨联合硬件生态伙伴发布“硬件生态共创计划”,在联合研发、资源共享、联合授权、培训赋能等多个维度全面合作。截至11月,飞桨“硬件生态共创计划”成员已经从13家增加至28家。同时,飞桨携手英伟达、Arm、寒武纪、昆仑芯、天数智芯、Graphcore、燧原等12家厂商联合发布了飞桨生态发行版,在为开发者提供更好的软硬一体化体验的同时,携手共建繁荣硬件生态。
为进一步加速AI产业智能化升级,飞桨深入产业场景,联合国家能源集团、中国工商银行、中国联通、中国石油、中国铁道科学研究院、中国移动、中国一汽等行业龙头企业,发布产业实践范例征集计划,链接企业与开发者,解决各行业实际产业场景中的关键问题,助力AI产业落地。
飞桨建设的AI Studio学习与实训社区致力于让AI学习和应用更简单,目前也已成为国内最大的AI开发者社区。本次峰会上,AI Studio升级新增两大板块:企业实训和生态异构算力中心。
企业实训为企业应用深度学习提供了实训阵地。截至目前,飞桨已与20余家知名企业联合举办赛事,共同探索AI应用方案,培养AI人才。长期以来,AI Studio为广大开发者提供了包括CPU和GPU的丰富算力资源,又接入了曙光DCU算力,为开发者提供线上体验中心,为硬件基础设施提供便捷的体验环境,生态异构算力中心欢迎更多硬件厂商入驻。
源于产业实践的百度飞桨深度学习开源开放平台,是百度践行融合创新、降低门槛的AI大生产平台。未来,随着深度学习核心技术的持续深耕,飞桨将更好地支撑AI与大模型落地应用,不断建设更加繁荣的AI生态,推动产业加速实现智能化升级,让AI惠及千行百业。
以上是用飞桨一站式搞定大模型生产 PaddleFleetX大模型开发套件业内首发的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

图像标注是将标签或描述性信息与图像相关联的过程,以赋予图像内容更深层次的含义和解释。这一过程对于机器学习至关重要,它有助于训练视觉模型以更准确地识别图像中的各个元素。通过为图像添加标注,使得计算机能够理解图像背后的语义和上下文,从而提高对图像内容的理解和分析能力。图像标注的应用范围广泛,涵盖了许多领域,如计算机视觉、自然语言处理和图视觉模型具有广泛的应用领域,例如,辅助车辆识别道路上的障碍物,帮助疾病的检测和诊断通过医学图像识别。本文主要推荐一些较好的开源免费的图像标注工具。1.Makesens

人脸检测识别技术已经是一个比较成熟且应用广泛的技术。而目前最为广泛的互联网应用语言非JS莫属,在Web前端实现人脸检测识别相比后端的人脸识别有优势也有弱势。优势包括减少网络交互、实时识别,大大缩短了用户等待时间,提高了用户体验;弱势是:受到模型大小限制,其中准确率也有限。如何在web端使用js实现人脸检测呢?为了实现Web端人脸识别,需要熟悉相关的编程语言和技术,如JavaScript、HTML、CSS、WebRTC等。同时还需要掌握相关的计算机视觉和人工智能技术。值得注意的是,由于Web端的计

机器之能报道编辑:吴昕国内版的人形机器人+大模型组队,首次完成叠衣服这类复杂柔性材料的操作任务。随着融合了OpenAI多模态大模型的Figure01揭开神秘面纱,国内同行的相关进展一直备受关注。就在昨天,国内"人形机器人第一股"优必选发布了人形机器人WalkerS深入融合百度文心大模型后的首个Demo,展示了一些有趣的新功能。现在,得到百度文心大模型能力加持的WalkerS是这个样子的。和Figure01一样,WalkerS没有走动,而是站在桌子后面完成一系列任务。它可以听从人类的命令,折叠衣物

多模态文档理解能力新SOTA!阿里mPLUG团队发布最新开源工作mPLUG-DocOwl1.5,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。话不多说,先来看效果。复杂结构的图表一键识别转换为Markdown格式:不同样式的图表都可以:更细节的文字识别和定位也能轻松搞定:还能对文档理解给出详细解释:要知道,“文档理解”目前是大语言模型实现落地的一个重要场景,市面上有很多辅助文档阅读的产品,有的主要通过OCR系统进行文字识别,配合LLM进行文字理

FP8和更低的浮点数量化精度,不再是H100的“专利”了!老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官方支持的条件下,硬生生在A100上跑起FP6。测试结果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。在此基础之上,还有端到端的大模型支持,目前已经开源并集成到了DeepSpeed等深度学习推理框架中。这一成果对大模型的加速效果也是立竿见影——在这种框架下用单卡跑Llama,吞吐量比双卡还要高2.65倍。一名

向大家介绍一个最新的AIGC开源项目——AnimagineXL3.1。这个项目是动漫主题文本到图像模型的最新迭代,旨在为用户提供更加优化和强大的动漫图像生成体验。在AnimagineXL3.1中,开发团队着重优化了几个关键方面,以确保模型在性能和功能上达到新的高度。首先,他们扩展了训练数据,不仅包括了之前版本中的游戏角色数据,还加入许多其他知名动漫系列的数据纳入训练集中。这一举措丰富了模型的知识库,使其能够更全面地理解各种动漫风格和角色。AnimagineXL3.1引入了一组新的特殊标签和美学标

最新国产开源MoE大模型,刚刚亮相就火了。DeepSeek-V2性能达GPT-4级别,但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。因此一经发布,立马引发不小讨论。图片通过公布的性能指标来看,DeepSeekV2的中文综合能力超越一众开源模型,同时GPT-4Turbo、文快4.0等闭源模型同处第一梯队。英文综合能力也和LLaMA3-70B同处第一梯队,并且超过了同是MoE的Mixtral8x22B。在知识、数学、推理、编程等方面也表现出不错性能。并支持128K上下文。图片这

当今人工智能(AI)技术的发展如火如荼,它们在各个领域都展现出了巨大的潜力和影响力。今天大姚给大家分享4个.NET开源的AI模型LLM相关的项目框架,希望能为大家提供一些参考。https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/DotNetProjectPicks.mdSemanticKernelSemanticKernel是一种开源的软件开发工具包(SDK),旨在将大型语言模型(LLM)如OpenAI、Azure
