讯飞星火V3.5正式发布，基于全国产算力平台'飞星一号”训练-人工智能-PHP中文网

讯飞星火V3.5正式发布，基于全国产算力平台'飞星一号”训练

WBOY

发布： 2024-04-10 14:49:01

转载

1057 人浏览过

科大讯飞将在1月30日举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。

科大讯飞宣布于2023年10月24日，发布首个支撑万亿参数大模型训练的万卡国产计算力平台“飞星一号”，正式启用。启用后的90多天里，讯飞星火基于“飞星一号”，启动了对标GPT-4的更大参数规模的大模型训练，带来了1月30日这场讯飞星火V3.5升级发布。

基于全民开放大模型训练的全民开放大模型火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面取得了全面升级。其中语言理解、数学能力超过GPT-4 Turbo，代码达到GPT-4 Turbo 96%，多模态理解达到GPT-4V 91%。

目前，讯飞星火已赋能保险、银行、能源、汽车、通信等领域联合龙头企业，通过与太平洋保险合作，通过星火太平洋保险合作，通过星火太平洋计划赋能内部知识服务、办公、审计、展业等，打造数字劳动力在保险领域的应用标杆；联合交通银行，赋能客服、展业、办公、研发等，重点打造银行领域的代码能力应用标杆；与国家能源集团联合，赋能煤炭、电力、运输、化工等方面，打造央企集团一体化联动的大模型应用标杆；与国家能源集团联合，赋能煤炭、电力、运输、化工等方面，打造央企集团一体化联动的大模型应用标杆。

除此之外，深度适配国产算力的“讯飞星火开源大模型”首次发布，场景应用效果领先，昇思开源社区联合首发上线。

讯飞星火V3.5正式发布，基于全国产算力平台飞星一号”训练

这次开源拥有1.3亿参数（13B），包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat，开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可基于全栈自主可控的星火优化套件，更便利地训练自己的专用大模型。

刘庆峰透露，星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中名列前茅，在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中，通过对学习辅助、语言理解等领域的深入研究和优化，实现了性能大幅提升，在处理复杂的自然语言任务时更加得心应手。

基于“飞星一号”训练，星火开源大模型全栈国产适配优化，简单易用，场景应用效果领先，训练策略针对昇腾算力极致优化，训练效率达A100的90%。这不仅是对昇腾AI硬件的进一步深度优化，也展示了国产算力在追赶国际先进水平方面的决心和能力。

开源只有更多的场景落地，才能更好地增进生态合作。目前，华为昇思开源社区已正式上架星火大模型开源版-13B，面对学术、企业研究完全免费，增进学术合作的同时，增进产业探索。

展望2024年讯飞星火大模型发展，刘庆峰指出三点：“首先，一定要在通用大模型的底层能力上持续对标国际最先进水平，从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距，当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距，讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。“今天的通用大模型并不一定代表人工智能的全部未来，还有很多创新要做，如脑科学互动、对抗网络的深度连接等需要整个创新的生态，但我们一定要有勇气、有期许走在最前列。”刘庆峰指出。

“第二，2024年要真正让大模型量质齐飞，不仅是行业应用，还要在很多关键技术创新上联动大模型，中国企业界、科学界有信心实现超越。”

“第三，高楼大厦要建立在安全可控的平台之上，我们要实现自主可控平台上的生态繁荣。”刘庆峰表示，自己有信心，能够实现从算法、数据、应用场景到算力，构建一个完全自主可控的繁荣的人工智能生态。

以上是讯飞星火V3.5正式发布，基于全国产算力平台'飞星一号”训练的详细内容。更多信息请关注PHP中文网其他相关文章！