2025年のトップ13の小言語モデル（SLMS）

今年、OpenaiのO1のようなコンパクト言語モデル（CLM）は大きな注目を集め、印象的な自然言語処理能力を示しています。ただし、多くのアプリケーションは、より大きなモデルの膨大なリソースを必要としません。小言語モデル（SLMS）を入力します - 予算に配慮したアプリケーションと限られた計算環境に最適な効率的で合理化されたソリューション。

SLMSバランスのパフォーマンスと効率。最適化されたアーキテクチャとサイズにより、エッジデバイス、リソース制約システム、および迅速な推論が必要なアプリケーションに最適です。モバイルアプリの電源を入れることから、オフラインのNLP機能を提供することまで、これらのモデルは高度な言語技術を民主化しています。

このブログでは、13のトップパフォーマンスのSLMを探ります。あなたが軽量ソリューションを求めている開発者であろうと、効率的なNLPを調査している研究者であろうと、このリストは、より小さいことがより良いことを示しています。これらのコンパクトモデルがどのように大きな影響を与えているかを探りましょう。

汎用性の高いマルチタスクパフォーマンス（翻訳、要約、Q＆A）
- T5
- Qwen-2
- ラマ3.2
- ミストラルネモ
- ミストラルスモール3
推論に焦点を当てたタスク
- o3-mini
- PHI-4
テキスト生成
- Distilgpt-2
- smollm
General NLU（テキスト分類、センチメント分析、エンティティ認識という名前）
- ミニルム
- MobileBert
- Microsoft Phi 3.5 Mini
- ジェマ2
- タイニーバート
- Distilbert
よくある質問

SLMSに深く潜るために、小さな言語モデル（SLM）とは何ですか？次に、これら13の主要なSLMを調べてみましょう。

汎用性の高いマルチタスクパフォーマンス（翻訳、要約、Q＆A）

T5

Google ResearchのT5（テキストからテキストへの転送トランス）は、さまざまなNLPタスク（翻訳、要約、Q＆A）の統一されたテキストツーテキストフレームワークを使用した多用途のモデルです。

パラメーターサイズ

T5は、T5-Small（6,000万パラメーター）からT5-11B（110億パラメーター）まで、さまざまなサイズを提供し、多様なリソースニーズに応えています。

建築

T5のトランスアーキテクチャは、エンコーダーコンポーネントとデコーダーコンポーネントを使用しており、すべてのタスクをテキストからテキストの問題としてフレーミングすることで柔軟性を強調しています。大規模なデータセットでの事前トレーニングは、その理解を高めます。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

T5はオープンソース（Apache 2.0ライセンス）で、TensorflowおよびHugging Faceを介してアクセスできます。

Qwen-2

QWEN-2は、さまざまなアプリケーションに適したテキスト生成、分類、要約に優れた効率的なCLMです。そのモジュラー設計は、制約されたハードウェアに最適です。

パラメーターサイズ

QWEN-2には30億、70億、および130億のパラメーターバージョンがあり、さまざまなアプリケーションのスケーラビリティを提供します。

建築

QWEN-2の高度な変圧器アーキテクチャは、回転式位置埋め込みや速度と安定性のための適応前の正規化などの手法を使用します。そのモジュール性により、適応性が保証されます。

可用性

QWEN-2はオープンソースで、サブスクリプションでいくつかの高度な機能を使用できます。

ラマ3.2

Llama 3.2は、リソース効率で高性能を優先し、計算オーバーヘッドが低いアプリケーションに適しています。

パラメーターサイズ

Llama 3.2は、13億から130億のパラメーターの範囲のバージョンを提供しているため、ユーザーはニーズに基づいて選択できます。

建築

Llama 3.2は、グループ化されたクエリの注意、回転位置埋め込み（ロープ）、およびSwigluの活性化を使用して、効率とパフォーマンスを使用します。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

Llama 3.2はオープンソースで、無料のティアと拡張機能とサポートのための有料オプションがあります。

ミストラルネモ

Mistral Nemoは、高品質の言語の理解と生成のために設計されたコンパクトで効率的なCLMであり、パフォーマンスと統合の容易さを強調しています。

パラメーターサイズ

Mistral Nemoは、13億、70億、および130億のパラメーターバージョンで利用できます。

建築

Mistral Nemoの変圧器ベースのアーキテクチャは、最適化された注意メカニズムと、効率的なメモリの使用とスループットのために強化されたトークン埋め込みを使用します。

可用性

Mistral Nemoはオープンソースです。

ミストラルスモール3

Mistral Small 3は、控えめなハードウェア要件を備えた生成AIタスクの約80％を処理します。

パラメーターサイズ

Mistral Small 3には240億パラメーターがあり、はるかに大きなモデルに匹敵するパフォーマンスを提供します。単一のハイエンドGPUまたは強力なラップトップに展開できます。

建築

Mistral Small 3は、低遅延性能のために競合するモデルよりも少ないレイヤーを使用します。事前に訓練されたバージョンと命令チューニングバージョンで利用できます。

可用性

Mistral Small 3はオープンソース（Apache 2.0ライセンス）で、Face、Ollama、Kaggleで利用できます。

推論に焦点を当てたタスク

o3-mini

O3-MINIは、パラメーター数が減少しているにもかかわらず、高性能を達成するコンパクトモデルであり、リソースに制約のあるデバイスに適しています。

パラメーターサイズ

O3-MINIのパラメーターカウントが大幅に削減されると、リソースが限られているデバイスで効率的な操作が可能になります。

建築

Openaiの推論モデルシリーズの一環として、O3-Miniはテキスト入力/出力と調整可能な推論レベルをサポートしています。

可用性

O3-MINIは、ChatGPT、OpenAI API、Microsoft Azure Openaiサービス、およびオープンルーターを介してアクセスできます。

PHI-4

MicrosoftのPHI-4（140億パラメーター）は、計算効率を維持しながら、推論タスクに優れています。

パラメーターサイズ

PHI-4の140億個のパラメーターは、推論効率と計算需要の削減に最適化されています。

アーキテクチャとトレーニング

合成データ生成と改良技術を含むPHI-4のアーキテクチャとトレーニングプロセスは、その推論能力を高めます。

可用性

PHI-4は現在専有です。

テキスト生成

Distilgpt-2

Distilgpt-2はGPT-2のより小さく、より効率的なバージョンであり、その機能のほとんどを保持しながら、そのサイズを大幅に削減します。

パラメーターサイズ

Distilgpt-2には通常、約8,200万のパラメーターがあり、GPT-2から大幅に減少します。

建築

Distilgpt-2は、同様のトランスアーキテクチャをGPT-2に使用しますが、知識の蒸留によって達成される層が少なくなります。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

Distilgpt-2はオープンソース（顔を抱き締める）です。

smollm

SMOLLMは、計算フットプリントを削減した効率的なNLP用に設計された軽量モデルです。

パラメーターサイズ

SMOLLMは、1,000万から3億パラメーターのさまざまなサイズを提供しています。

建築

Smollmは、効率のために剪定、量子化、および適応計算方法を備えたトランスベースの設計を使用しています。

可用性

Smollmはオープンソースで、無料の層と有料のオプションがあります。

General NLU（テキスト分類、センチメント分析、エンティティ認識という名前）

ミニルム

Microsoft's Minilmは、知識蒸留技術を使用したコンパクトで効率的なモデルです。

パラメーターサイズ

Minilmは、2,200万から3億8400万のパラメーターにさまざまなサイズを提供しています。

建築

Minilmは、知識の蒸留を組み込んで、より大きなモデルからパフォーマンスを移転する、深い自己告発メカニズムを使用しています。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

ミニルムはオープンソースです（顔を抱き締め、github）。

MobileBert

MobileBertは、リソース制約のデバイス向けに設計されたBertの軽量化です。

パラメーターサイズ

MobileBertには約2500万のパラメーターがあります。

建築

MobileBertは、ボトルネック構造、逆ボトルネック層、および効率のために4倍のフィードフォワードネットワークを使用します。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

MobileBertはオープンソースです。

Microsoft Phi 3.5 Mini

Microsoft Phi 3.5ミニバランスの効率とパフォーマンスは、限られたリソースを備えた堅牢な自然言語理解のためのパフォーマンス。

パラメーターサイズ

Phi 3.5 Miniには、13億と30億のパラメーターバージョンがあります。

建築

PHI 3.5 Mini's Transformer Architectureは、効率のために最適化された注意メカニズムを使用しています。

可用性

Microsoft Phi 3.5 Miniは独自のもので、Microsoft Azure AI Services（無料および有料層）に統合されています。

ジェマ2

Gemma 2は、効率的なNLUおよび生成タスクのために設計されており、精度と速度のバランスを取ります。

パラメーターサイズ

Gemma 2には、1億2500万、3億5,000万、および12億パラメーターを備えたバージョンを提供しています。

建築

Gemma 2は、動的な注意ヘッドと層の正規化の強化を備えた合理化されたトランスアーキテクチャを使用しています。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

Gemma 2はオープンソース（許容ライセンス）で、無料でプレミアムなオプションがあります。

タイニーバート

TinybertはBertの蒸留バージョンであり、計算の複雑さとメモリフットプリントを削減します。

パラメーターサイズ

Tinybertの最小バージョンには約1400万のパラメーターがありますが、大きなバージョンには約6600万個があります。

建築

Tinybertは、同様のトランスアーキテクチャをBertに使用しますが、層が少なく、寸法が減少しています。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

Tinybertはオープンソース（Apacheライセンス2.0）で、フェイストランスを抱き締めることでアクセスできます。

Distilbert

Distilbertは、より小さく、より速く、より軽いバージョンのBertであり、Bertのパフォーマンスのほとんどを保持しています。

パラメーターサイズ

Distilbertには約6600万のパラメーターがあります。

建築

Distilbertは、レイヤーの数を減らし、知識の蒸留を使用することにより、Bertのアーキテクチャを簡素化します。

2025年のトップ13の小言語モデル（SLMS） - 分析vidhya

可用性

Distilbertはオープンソースです（フェイストランスを抱き締めます）。

結論

SLMは、パフォーマンス、効率、アクセシビリティのバランスを提供することにより、NLPに革命をもたらしています。リソースに制約された環境への適合性により、さまざまなアプリケーションに最適です。オープンソースと独自のモデルは、イノベーションを促進し、高度な言語技術へのアクセスを拡大しています。 AIの採用が成長するにつれて、SLMはNLPを効率的かつ包括的にスケーリングするために重要になります。