OpenAI被曝将发布全新开源大模型,网友:GPT平替?
OpenAI终于要“Open”了!
最新爆料,他们正准备发布全新的开源语言模型。
GPT-2之后,这尚属四年来首次。
不少网友戳戳手表示期待:这是要发自己的开源平替了吗?
毕竟目前最好的开源模型与GPT-4还相差较远。仅就参数而言,两者之间的数量相差三个数量级,一个为200亿,另一个为1.3万亿。
OpenAI要Open了
既然如此,那么OpenAI此举“会改变整个大模型的竞争格局吗?”。
不少网友表示,首当其冲的可能就是LLaMA大模型即羊驼家族。
毕竟ChatGPT诞生以来,各种开源方案层出不穷,但大部分都受到Meta这个大模型启发。
比如斯坦福的Alpaca、伯克利的Vicuna、Kaola,还有ColossalChat,以及国内哈工大基于中文医学知识的LLaMA微调模型华驼……这些开源模型有一些甚至已经被优化到可以在手机端设备运行。
而UC伯克利打造的大模型Chatbot Arena排行榜最新显示,众多开源模型紧跟在GPT-4和Claude之后。
不过是否会是“平替”这一点,还得等最终发布才会知道。
以及OpenAI会不会用这个模型,与其他同类开源模型竞争也暂未可知。
据The Information援引知情人士报道,可以肯定的是,这个开源新模型将不太可能与GPT产生竞争关系。
与此同时,又有人在点名谷歌:这下谷歌的压力越来越大。
有关开源与护城河也在这当中引发了热议。
开源和护城河
开源还是闭源?This is A question.
前段时间,一份谷歌的内部文件在网上激起千层浪,当中核心观点十分明确:
开源大模型迅猛发展,正在侵蚀OpenAI和谷歌的阵地。
并且表示,“除非改变闭源的立场,否则开源替代品将最终使它们(包括ChatGPT)黯然失色”。
就这点来说,这场大模型军备竞赛中,谷歌和OpenAI都没有护城河。
很多开源问题已经被解决,比如可以在较低功率的设备上运行、可扩展的个人AI、多模态等。
即便现在OpenAI与谷歌在模型质量上有一定优势,但这个差距正在快速缩小。
过去数周内,开源AI领域的每个团队都有着持续不断地进展,不管是从模型还是在应用的维度。
比如AI创业公司Together,在上个月基于LLaMA构建开源大模型和云平台,如今筹集到2000万美元种子轮资金。
这种趋势甚至还延续到了线下,不少人为开源运动而狂欢和庆祝。
“开源中心”HuggingFace除了上线一系列大模型工具,甚至还在线下“Woodstock of AI”的聚会,吸引了5000多人参加。
而Stable Diffusion背后公司Stability AI与开发了PyTorch Lightning 的Lightning AI,也打算举行一场开源交流会。
在不少人看来,OpenAI和谷歌开了个不好的先例:不受监控的模型,其危险是真实存在的。
尽管这些大型科技公司的模型可能无法完全复制,开源社区了解这些“秘方”中的基本成分。但现在任何人都无法知道其成分。
对于这件事,你怎么看呢?
参考链接:
[1]https://www.reuters.com/technology/openai-readies-new-open-source-ai-model-information-2023-05-15/
[2]https://www.theinformation.com/articles/open-source-ai-is-gaining-on-google-and-chatgpt
[3]https://venturebeat.com/ai/open-source-ai-continues-to-celebrate-as-big-tech-mulls-over-moats/
以上是OpenAI被曝将发布全新开源大模型,网友:GPT平替?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效的特点。它由236B个参数组成,其中21B个参数用于激活每个标记。与DeepSeek67B相比,DeepSeek-V2性能更强,同时节省了42.5%的训练成本,减少了93.3%的KV缓存,最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

本月初,来自MIT等机构的研究者提出了一种非常有潜力的MLP替代方法——KAN。KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参数量运行的MLP。比如,作者表示,他们用KAN以更小的网络和更高的自动化程度重现了DeepMind的结果。具体来说,DeepMind的MLP有大约300,000个参数,而KAN只有约200个参数。KAN与MLP一样具有强大的数学基础,MLP基于通用逼近定理,而KAN基于Kolmogorov-Arnold表示定理。如下图所示,KAN在边上具

特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣:这次放出的视频亮点之一在于Optimus在厂子里完成这项工作,是完全自主的,全程没有人为的干预。并且在Optimus的视角之下,它还可以把放歪了的电池重新捡起来放置,主打一个自动纠错:对于Optimus的手,英伟达科学家JimFan给出了高度的评价:Optimus的手是全球五指机器人里最灵巧的之一。它的手不仅有触觉

目标检测在自动驾驶系统当中是一个比较成熟的问题,其中行人检测是最早得以部署算法之一。在多数论文当中已经进行了非常全面的研究。然而,利用鱼眼相机进行环视的距离感知相对来说研究较少。由于径向畸变大,标准的边界框表示在鱼眼相机当中很难实施。为了缓解上述描述,我们探索了扩展边界框、椭圆、通用多边形设计为极坐标/角度表示,并定义一个实例分割mIOU度量来分析这些表示。所提出的具有多边形形状的模型fisheyeDetNet优于其他模型,并同时在用于自动驾驶的Valeo鱼眼相机数据集上实现了49.5%的mAP

FP8和更低的浮点数量化精度,不再是H100的“专利”了!老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官方支持的条件下,硬生生在A100上跑起FP6。测试结果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至偶尔超过INT4,而且拥有比后者更高的精度。在此基础之上,还有端到端的大模型支持,目前已经开源并集成到了DeepSpeed等深度学习推理框架中。这一成果对大模型的加速效果也是立竿见影——在这种框架下用单卡跑Llama,吞吐量比双卡还要高2.65倍。一名

如果AI模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的系统来说是可读的,即可以完全理解以至于任何可能的错误都可以被发现。例如,为了建立对司法系统的信任,我们要求法院提供清晰易读的书面意见,解释并支持其决策。对于大型语言模型来说,我们也可以采用类似的方法。不过,在采用这种方法时,确保语言模型生

写在前面项目链接:https://nianticlabs.github.io/mickey/给定两张图片,可以通过建立图片之间的对应关系来估计它们之间的相机姿态。通常,这些对应关系是二维到二维的,而我们估计的姿态在尺度上是不确定的。一些应用,例如随时随地实现即时增强现实,需要尺度度量的姿态估计,因此它们依赖于外部的深度估计器来恢复尺度。本文提出了MicKey,这是一个关键点匹配流程,能够够预测三维相机空间中的度量对应关系。通过学习跨图像的三维坐标匹配,我们能够在没有深度测试的情况下推断出度量相对

在软件技术的前沿,UIUC张令明组携手BigCode组织的研究者,近日公布了StarCoder2-15B-Instruct代码大模型。这一创新成果在代码生成任务取得了显着突破,成功超越CodeLlama-70B-Instruct,登上代码生成性能榜单之巅。 StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略,整个训练流程公开透明,且完全自主可控。该模型通过StarCoder2-15B生成了数千个指令,响应对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数
