目录
多语言+多模态
坚持开源的Falcon
首页 科技周边 人工智能 时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Jun 09, 2024 pm 05:25 PM
ai 数据

这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。

就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2 11B已开启访问,Falcon 2 11B VLM将在5月14日中午12点开放

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

新一代「猎鹰」(Falcon意为猎鹰)重返竞技场,一经推出,迅速登上了HN热榜第一。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

去年Falcon首次推出就技惊四座,以碾压性的优势超越了Llama。

根据Hugging Face排行榜,这次推出的Falcon 2 11B性能再次超越了Llama 3 8B,与领先的Gemma 7B性能相当,平均性得分仅差0.01。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2包括两个版本:Falcon 2 11B和Falcon 2 11B VLM。

前者是在 5.5 万亿个token上训练出的大语言模型,后者则在此基础上开发的「视觉到语言」模型。

作为一款开源的大语言模型,Falcon 2不仅具备多语言能力,而且支持多模态,可以将视觉输入无缝转换为文本输出,这种功能是当今大模型市场中的首创。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

只需要在用户界面上传一张图片并输入提示,就可以得到一段关于图片的文字描述

多语言+多模态

Falcon 2 11B 具有多语言能力,可以快速响应英语、法语、西班牙语、德语、葡萄牙语和其他各种语言的任务。

Falcon 2 11B VLM 作为视觉语言模型,能够从环境中识别和解释各种视觉信息,因此在医疗、金融、电子商务、教育和法律等领域有广泛的应用场景。

比如用于文档管理、上下文索引等任务,而且其「视觉到语言」的功能还有望在未来为视障人群提供帮助。

此外,Falcon 2只需一个GPU就能高效运行,可以轻易部署在笔记本电脑上。

为了加快推进Falcon商业化的进程,去年11月,ATRC就成立了一家新公司——AI71

基于Falcon模型,AI71已经进军阿联酋的教育、医疗、法律等多个领域,并计划很快拓展到阿联酋以外。Falcon的本次升级,为其商业化进程提供了有力支撑。

坚持开源的Falcon

TII发布的人工智能模型,在全球范围内一直名列前茅,新推出的Falcon 2 11B 模型让TII的地位再次得到稳固。

更重要的是,本次更新的两个模型版本均已开源,全世界的开发人员都可以不受限制地使用,并在此基础上进行开发和部署。模型展现出的优秀性能意味着TII有望与Meta竞争开源宇宙霸主的地位。

阿布扎比先进技术研究委员会(ATRC)秘书长 Faisal Al Bannai 承诺,将会坚持推动开源创新,帮助全世界的开发者们实现他们的AI之旅。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

TII首席研究员Hakim Hacid博士也表示「开发人员正在认识到更小、更高效模型的无数好处······这是下一个新兴的大趋势。此外,Falcon 2的视觉转语言能力为人工智能的易用性开辟了新的前景,为用户提供了变革性的从图像到文本的交互方式。」

TII还透露其正在酝酿Falcon 2下一代模型,推出时间将在不久之后,这些模型的性能将通过专家混合(MoE)技术得到进一步增强。

开源与闭源之争,战局未定。但无论如何,TII已经成为AGI领域的一支劲旅,这背后是阿联酋自上而下形成的合力,他们正全力推动人工智能的发展,将这项技术视为继石油之后的下一个经济支柱。

Falcon不仅仅是作为「严肃的参与者」而存在,而是雄心勃勃振翅盘旋的「猎鹰」。

以上是时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1668
14
CakePHP 教程
1426
52
Laravel 教程
1329
25
PHP教程
1273
29
C# 教程
1256
24
C  中的chrono库如何使用? C 中的chrono库如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono库可以让你更加精确地控制时间和时间间隔,让我们来探讨一下这个库的魅力所在吧。C 的chrono库是标准库的一部分,它提供了一种现代化的方式来处理时间和时间间隔。对于那些曾经饱受time.h和ctime折磨的程序员来说,chrono无疑是一个福音。它不仅提高了代码的可读性和可维护性,还提供了更高的精度和灵活性。让我们从基础开始,chrono库主要包括以下几个关键组件:std::chrono::system_clock:表示系统时钟,用于获取当前时间。std::chron

如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接内存访问技术,允许硬件设备直接与内存进行数据传输,不需要CPU干预。1)DMA操作高度依赖于硬件设备和驱动程序,实现方式因系统而异。2)直接访问内存可能带来安全风险,需确保代码的正确性和安全性。3)DMA可提高性能,但使用不当可能导致系统性能下降。通过实践和学习,可以掌握DMA的使用技巧,在高速数据传输和实时信号处理等场景中发挥其最大效能。

C  中的实时操作系统编程是什么? C 中的实时操作系统编程是什么? Apr 28, 2025 pm 10:15 PM

C 在实时操作系统(RTOS)编程中表现出色,提供了高效的执行效率和精确的时间管理。1)C 通过直接操作硬件资源和高效的内存管理满足RTOS的需求。2)利用面向对象特性,C 可以设计灵活的任务调度系统。3)C 支持高效的中断处理,但需避免动态内存分配和异常处理以保证实时性。4)模板编程和内联函数有助于性能优化。5)实际应用中,C 可用于实现高效的日志系统。

给MySQL表添加和删除字段的操作步骤 给MySQL表添加和删除字段的操作步骤 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,删除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段时,需指定位置以优化查询性能和数据结构;删除字段前需确认操作不可逆;使用在线DDL、备份数据、测试环境和低负载时间段修改表结构是性能优化和最佳实践。

怎样在C  中测量线程性能? 怎样在C 中测量线程性能? Apr 28, 2025 pm 10:21 PM

在C 中测量线程性能可以使用标准库中的计时工具、性能分析工具和自定义计时器。1.使用库测量执行时间。2.使用gprof进行性能分析,步骤包括编译时添加-pg选项、运行程序生成gmon.out文件、生成性能报告。3.使用Valgrind的Callgrind模块进行更详细的分析,步骤包括运行程序生成callgrind.out文件、使用kcachegrind查看结果。4.自定义计时器可灵活测量特定代码段的执行时间。这些方法帮助全面了解线程性能,并优化代码。

量化交易所排行榜2025 数字货币量化交易APP前十名推荐 量化交易所排行榜2025 数字货币量化交易APP前十名推荐 Apr 30, 2025 pm 07:24 PM

交易所内置量化工具包括:1. Binance(币安):提供Binance Futures量化模块,低手续费,支持AI辅助交易。2. OKX(欧易):支持多账户管理和智能订单路由,提供机构级风控。独立量化策略平台有:3. 3Commas:拖拽式策略生成器,适用于多平台对冲套利。4. Quadency:专业级算法策略库,支持自定义风险阈值。5. Pionex:内置16 预设策略,低交易手续费。垂直领域工具包括:6. Cryptohopper:云端量化平台,支持150 技术指标。7. Bitsgap:

数字虚拟币交易平台top10 安全可靠的十大数字货币交易所 数字虚拟币交易平台top10 安全可靠的十大数字货币交易所 Apr 30, 2025 pm 04:30 PM

数字虚拟币交易平台top10分别是:1. Binance,2. OKX,3. Coinbase,4. Kraken,5. Huobi Global,6. Bitfinex,7. KuCoin,8. Gemini,9. Bitstamp,10. Bittrex,这些平台均提供高安全性和多种交易选项,适用于不同用户需求。

deepseek官网是如何实现鼠标滚动事件穿透效果的? deepseek官网是如何实现鼠标滚动事件穿透效果的? Apr 30, 2025 pm 03:21 PM

如何实现鼠标滚动事件穿透效果?在我们浏览网页时,经常会遇到一些特别的交互设计。比如在deepseek官网上,�...

See all articles