社区

学习

工具库

AI工具

休闲

简体中文

首页 > 科技周边 > 人工智能 > Mistral与微软合作为'小语言模型'带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为'小语言模型'带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2023-12-17 14:15:35

转载

840 人浏览过

近来，"小语言模型"突然成为热门话题

本周一，刚刚完成4.15亿美元融资的法国AI初创公司Mistral，发布了Mixtral 8x7B模型。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

这个开源模型尽管尺寸不大，小到足以在一台内存100GB以上的电脑上运行，然而在某些基准测试中却能和GPT-3.5打平，因此迅速在开发者中赢得了一片称赞。

之所以叫Mixtral 8x7B，是因为它结合了为处理特定任务而训练的各种较小模型，从而提高了运行效率。

这种「稀疏专家混合」模型并不容易实现，据说OpenAI在今年早些时候因为无法让MoE模型正常运行，而不得不放弃了模型的开发。

紧接着，就在第二天，微软又发布了全新版本的Phi-2小模型。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Phi-2的规模只有27亿参数，比Mistral的规模小得多，仅足以在手机上运行。而与之相比，GPT-4的参数规模高达一万亿

Phi-2在精心挑选的数据集上进行了训练，数据集的质量足够高，因此即使手机的计算能力有限，也能确保模型生成准确的结果。

虽然还不清楚微软或其他软件制造商将如何使用小型模型，但最明显的好处，就是降低了大规模运行AI应用的成本，并且极大地拓宽了生成式AI技术的应用范围。

这是一个重要的事件

Mistral-medium代码生成完胜GPT-4

最近，Mistral-medium已经开始进行内测

有博主对比了开源的Mistral-medium和GPT-4的代码生成能力，结果显示，Mistral-medium比GPT-4的代码能力更强，然而成本却只需GPT-4的3成！

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

总价来说就是：

Mistral工作效率高，且完成工作的质量也很高

2）不会将token浪费在冗长的解释性输出上

3）给出的建议非常具体

首先，要编写用于生成斐波那契素数的PyTorch数据集的cuda优化代码

Mistral-Medium生成的代码严肃、完整。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

GPT-4生成的代码，勉勉强强还可以

浪费了很多token，却没有输出有用的信息。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

然后，GPT-4只给出了骨架代码，并没有具体的相关代码。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

第二道题是：编写高效的Python代码，将大约10亿个大型Apache HTTP访问文件导入SqlLite数据库，然后使用它来生成对sales.html和product.html的访问直方图

Mistral的输出非常出色，尽管log文件不是CSV格式的，但是修改起来很简单

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

GPT-4依旧拉跨。

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

此前，这位博主测试过多个代码生成模型，GPT-4一直稳居第一。

目前，强大的竞争对手Mistral-medium终于出现，将其从宝座上推下

虽然只发布了两个例子，但博主测试了多个问题，结果都差不多。

他提出建议：考虑到Mistral-medium在代码生成质量方面提供更好的体验，应该将其整合到各地的代码助手中

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

有人按照每1000token算出了输入和输出的成本，发现Mistral-medium比起GPT-4直接降低了70%！

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

确实，节省了70%的令牌费用，这是一件大事。此外，通过简洁的输出，还可以进一步降低成本

Mistral与微软合作为小语言模型带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3

以上是Mistral与微软合作为'小语言模型'带来革命，Mistral中杯代码能力超越GPT-4，成本降低2/3的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

微软模型

上一篇：宏碁发布新款非凡 Go 笔记本，搭载 Acer Sense 应用，提供多种AI功能下一篇：谷歌 DeepMind 公布的“FunSearch”训练法：让 AI 模型能够解决复杂离散数学问题

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

javascript - autodesk forge viewer 多模型加载模型浏览器问题

来自于 1970-01-01 08:00:00

0

0

0

关于模型的问题

来自于 1970-01-01 08:00:00

0

0

0

模型不收敛是怎么回事？

来自于 1970-01-01 08:00:00

0

0

0

Laravel关联模型的问题

来自于 1970-01-01 08:00:00

0

0

0

Laravel - 将模型关系更新到另一个模型

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1437213
php入门教程之一周学会PHP

4297034
JAVA 初级入门视频教程

2665749
小甲鱼零基础入门学习Python视频教程

516631
PHP 零基础入门教程

877447

最新下载

更多>

网站特效

网站源码

网站素材

前端模板