中国通过其AI模型再次做到了这一点,这次打击更大,更好! Baidu - 一家中国人工智能公司,最近发布了两种大型语言模型(LLMS) - Ernie 4.5和X1。这些模型声称要比Openai的最新和最出色的模型更好,这些模型比DeepSeek-R1更具成本效益!这些型号似乎太好了,无法实现 - 以价格的一小部分提供高质量。在此博客中,我们将探索Ernie 4.5和X1模型,评估其基准结果,并查看它们在现实世界应用程序中的表现。所以,让我们开始。
Ernie 4.5和X1是由领先的中国科技公司百度开发的两个最新的多模式LLM,专门从事互联网服务,人工智能和自动驾驶。它以其在中国的主要搜索引擎以及AI驱动创新的进步而闻名。百度(Baidu)于2021年12月推出了其第一个LLM Ernie 3.0 Titan。此后,它发布了更多型号,同时同时工作以构建更强大的LLMS。所有研究和持续努力的结果是Ernie 4.5和X1。
Ernie 4.5是一种能够理解和集成各种数据类型的多模式基础模型,包括文本,图像,音频和视频。这种多样化的建模方法增强了其理解和生成各种内容的能力。
以下是Ernie 4.5的一些关键特征:
Ernie X1被设计为具有多模式功能的深刻思维推理模型。这是百度发行的同类深思熟虑模型。以下是其主要特征:
您可以通过AI聊天机器人或通过API访问Ernie 4.5和X1。
通过机器人访问:
Baidu的Ernie Bot平台上的个别用户都可以自由访问这两种型号。但是,目前,Ernie Bot的注册仅限于中国国民。
通过API访问:
当前,该平台无法由所有用户访问。另外,仅通过API提供Ernie 4.5,而Ernie X1很快将在平台上提供。
在本节中,我们将找出这些模型在涉及多媒体,推理,文档分析等任务中的执行方式。由于模型接口仅支持中文,并且帐户创建仅限于中国国民,因此我们将研究一些人们如何使用这两种模型以及他们收到的输出的示例。我们将介绍我们在网上找到的Ernie 4.5和X1的一些最常见的用例,包括:
在此任务中,要求该模型解决以图像形式给出的数学问题。
使用的模型: Ernie 4.5
输出:
就像大多数其他多模式LLM一样,Ernie 4.5快速分析视频并解决图像中的问题。它将图像中的所有问题一个一个一个接一个地总结了所有问题。其性能的速度和准确性使其成为需要快速准确解决问题的学生,教育者,研究人员和专业人士的有用工具。
在这里,该模型得到了一个文档,它必须总结该文档中有关特定主题的信息。
使用的模型: Ernie 4.5
输出:
该模型允许您一次上传各种类型的多个文件。它能够处理不同类型的文件,包括文档,PDF,PPT,Excel表等。从上传的文件中,您可以选择要查询聊天机器人的一个(或更多),并迅速总结了主题。它快速处理多个文件对于研究分析,法律文档审查,财务数据提取和公司报告等任务非常有用。
为此,该模型必须分析给定的音频并找到其源。
使用的模型: Ernie 4.5
输出:
音频分析是一项功能,即流行的AI聊天机器人都没有在其界面中合并,这使Ernie 4.5(第一个同类)成为了Ernie 4.5。该模型快速分析剪辑,确定其源,甚至继续描述剪辑的重要性。它的快速分析和详细描述,使其成为跨越媒体,客户服务,教育和执法部门的实时转录,基于语音的搜索,深层捕获和情感分析等任务的宝贵工具。
对于此任务,该模型必须分析一个房间,并提出可能增强其整体吸引力的可能装饰。然后,它必须生成房间的更新图像。
使用的模型: Ernie X1
输出:
该模型快速处理图像。然后,它暗示了房间装饰的可能改进,以增强整体吸引力。最后,它通过所有建议的增强功能生成房间的图像。此功能是室内设计,家庭装修计划,房地产舞台和虚拟装饰可视化等任务的绝佳补充。
注意:我们以X上的这篇文章为例。
与OpenAI,DeepSeek,Grok,Claude等的顶级模型相比,Ernie 4.5和X1都具有所有功能,甚至更多的功能。这是这两个模型的定价分解:
模型 | 输入价格(每百万个令牌) | 输出价格(每百万个令牌) | 可用性 |
Ernie 4.5 | $ 0.55 | $ 2.20 | 可用的 |
Ernie X1 | $ 0.28 | $ 1.10 | 尚未可用 |
与其他顶级型号相比,Ernie 4.5和X1的价格明显便宜,使其成为生成AI的发展中的宝贵资产。
我们已经看到了最新的Ernie模型的功能,功能和定价。现在,让我们看一下这些模型的一些性能数字,例如GPT-4.5,GPT-4O,DeepSeek-R1等最高模型。
下图比较了测试多模式AI性能的多个基准测试的Ernie 4.5和GPT-4O。
该图显示:
下一张图比较了Ernie 4.5,DeepSeek V3 - CHAT,GPT-4O和GPT-4.5在多个基准测试中,用于基于文本的推理和解决问题。
这是图表中的一些关键要点:
成为LLM顶级LLM的比赛正在加热,Baidu的Ernie 4.5&X1为Openai,DeepSeek,Anthropic和Meta引发了激烈的竞争。随着中国人工智能实验室提供的模型可与成本的一小部分竞争或超过西部AI,公司将被迫更快地创新并降低其成本以保持竞争力。
所有这些进步最终将导致:
百度的Ernie 4.5和X1型号不仅是另一组AI模型,而且是行业破坏者。它们出色的多模式和推理能力,低价以及与中国数字生态系统的深入整合,这表明全球AI市场的权力转移。
如果这种趋势继续下去,我们将在各个行业看到大规模的AI民主化和推广。这也将促使许多西方公司发布更便宜的车型。这不仅会增加市场上的竞争力,而且还可以确保用户获得最大的价值。
A. Ernie 4.5和X1是Baidu开发的最新大型语言模型(LLMS),旨在与OpenAI的GPT-4.5和DeepSeek-R1(例如Openai的GPT-4.5和DeepSeek-R1)相媲美。 Ernie 4.5是一种多模式的基础模型,而Ernie X1是具有高级功能的深刻思维推理模型。
Q2。 Baidu的Ernie 4.5与Ernie X1有何不同?A. Ernie 4.5经过优化,可用于多模式理解,能够以很高的精度处理文本,图像,音频和视频。另一方面,Ernie X1旨在深入思考的推理,通过自我反思来解决情境理解,计划和解决问题。
Q3。 Ernie 4.5和X1与OpenAI的GPT-4.5相比如何?A. baidu Ernie 4.5在多个基准测试中胜过GPT-4.5,尤其是在推理,多模式理解和预防幻觉中,同时仅占GPT-4.5价格的1%。 Ernie X1以一半的成本提供DeepSeek-R1水平的性能,使其具有竞争激烈的AI解决方案。
Q4。 Ernie 4.5和X1的定价细节是什么? A. Ernie 4.5:输入成本$ 0.55每100万代币,输出成本为每100万代币2.20美元。
Ernie X1:输入的价格为每100万代币0.28美元,输出成本为每100万代币1.10美元。
Ernie X1模型尚未通过API可用,但很快就会出现。
答:您可以通过以下方式访问这些模型:
1。ernie bot(AI chatbot)atyyan.baidu.com(仅适用于中国用户)。
2。BaiduAI Cloud的MAAS平台Qianfan,用于API访问(目前只有Ernie 4.5可用)。
以上是Baidu' eernie 4.5&x1是否会替换GPT-4.5和DeepSeek-R1?的详细内容。更多信息请关注PHP中文网其他相关文章!