中国初创公司DeepSeek用其新的AI聊天机器人震惊了最大的硅谷玩家,与Openai的Chatgpt的表现相媲美,同时又花费的成本要少得多。在Apple的App Store上,美国,英国,中国和其他多个国家 /地区下载最多的免费应用程序。它的工作方式就像典型的聊天机器人:您输入查询,其开源模型会生成答案。基本的DeepSeek-V3模型具有6710亿个参数,使该应用在解决问题之前就可以“思考”。
与OpenAI的模型不同,它只能在自己的服务器上运行,DeepSeek可以在本地运行,可以在本地运行。高功率计算机和许多GPU加速服务器。该公司声称其模型与OpenAI的O1模型相匹配,以特定的基准测试。与许多其他AI聊天机器人不同,DeepSeek还透明地显示了其推理以及它如何得出答案。但是,作为中国应用程序,DeepSeek审查某些主题,例如Tiananmen Square。 DeepSeek的突然受欢迎程度归功于其匹配或单一建立的AI模型的能力。它的研究论文于周一发表,揭示了deepSeek-v3的成本效益培训是多么的。
> >
>虽然尚未验证其主张,但DeepSeek显然只使用了2,048个专业化。 NVIDIA H800芯片训练R1与16,000多个NVIDIA芯片一起训练Openai的领先型号。 DeepSeek说,AI培训所需的尖端GPU数量的急剧减少使其仅花费560万美元来培训R1。将此与Openai进行对比,Openai花费了超过1亿美元来培训其尺寸相当大的GPT-4型号。但是,该公司尚未量化DeepSeek相对于竞争对手的能源消耗。
R1本身基于DeepSeek的V3大语言模型(LLM),该公司表示,该模型与OpenAI的GPT-4O和Anthropic的Claude 3.5 Sonnet相匹配。鉴于美国政府对用于AI培训的复杂NVIDIA芯片实施贸易制裁,DeepSeek的成就尤其令人印象深刻。随着NVIDIA,OpenAI,Meta和Microsoft等最大的AI球员在其AI数据中心上花费了数十亿美元,我们将在本周看到许多头条新闻,向AI中的美国领导。
看到DeepSeek的突破对特朗普政府的十亿星之星项目(由OpenAI,Softbank和Oracle的返还)有多大的影响,目的是投资5000亿美元,以在接下来为OpenAI建立新的AI基础设施和数据中心为OpenAI中投资四年。由于DeepSeek已开源的AI模型,因此,随着从非营利组织向营利性组织的OpenAI过渡。 ,就像喇嘛LLM一样。尽管如此,DeepSeek还是一个每个人都在谈论的街区的新孩子,开发人员可以自由地以DeepSeek的技术为基础的事实可能会给Openai带来一笔钱。
以上是Chatgpt有一个新的竞争对手:见DeepSeek的详细内容。更多信息请关注PHP中文网其他相关文章!