智谱AI与清华KEG合作,发布了名为CogVLM-17B的开源多模态大模型

WBOY
发布: 2023-10-12 11:41:01
转载
1145 人浏览过

鞭牛士 10月12日消息,近日,智谱AI&清华KEG于魔搭社区发布并直接开源了多模态大模型——CogVLM-17B。据悉,CogVLM是一个强大的开源视觉语言模型,利用视觉专家模块深度整合语言编码和视觉编码,在14项权威跨模态基准上取得了SOTA性能。

智谱AI与清华KEG合作,发布了名为CogVLM-17B的开源多模态大模型

CogVLM-17B是目前多模态权威学术榜单上综合成绩第一的模型,在14个数据集上取得了最先进的或者第二名的成绩。CogVLM的效果取决于“视觉优先”的思想,即在多模态模型中将视觉理解放在更优先的位置。它使用了5B参数的视觉编码器和6B参数的视觉专家模块,总共有11B参数来建模图像特征,甚至比文本的7B参数还要多

以上是智谱AI与清华KEG合作,发布了名为CogVLM-17B的开源多模态大模型的详细内容。更多信息请关注PHP中文网其他相关文章!

相关标签:
来源:sohu.com
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!