GradioとLangchainでOLMO-2をローカルに実行します-AI-php.cn

ホームページ

テクノロジー周辺機器

GradioとLangchainでOLMO-2をローカルに実行します

William Shakespeare

Mar 06, 2025 am 10:55 AM

olmo 2：アクセス可能なAI

のための強力なオープンソースLLM

自然言語処理の分野（NLP）は、特に大規模な言語モデル（LLM）で急速に進歩しています。独自のモデルは歴史的に支配的でしたが、オープンソースの代替品は急速にギャップを埋めています。 Olmo 2は、完全な透明性とアクセシビリティを維持しながら、閉鎖モデルに匹敵するパフォーマンスを提供し、パフォーマンスを提供します。この記事は、トレーニング、パフォーマンス、および実用的なアプリケーションを調査し、Olmo 2を掘り下げています。

キー学習ポイント：

Olmo 2のアーキテクチャ、トレーニング方法、およびベンチマークの結果を理解してください
GradioとLangchainを使用して地元でOlmo 2を実行することを学ぶ。
（この記事はデータサイエンスブログの一部です。）

オープンソースLLMSの必要性

olmo 2の紹介 Olmo 2のトレーニングの分解

Olmo 2
結論
よくある質問
オープンソースLLMSの需要

AI（AI2）のOLMOプロジェクトのためのアレン研究所は、このコミットメントを実証しています。 Olmo 2は、単にモデルの重みをリリースするだけではありません。トレーニングデータ、コード、トレーニングレシピ、中級チェックポイント、命令チューニングモデルを提供します。この包括的なリリースは、再現性とさらなるイノベーションを促進します

olmo 2

を理解しています

Olmo 2は、その前身であるOlmo-0424を大幅に改善します。 7Bおよび13Bパラメーターモデルは、英語のアカデミックベンチマークでLlama 3.1のようなオープンウェイトモデルに匹敵する、またはそれを超えるパフォーマンスを示しています。

重要な改善には、次のものが含まれます

実質的なパフォーマンスの向上：Olmo-2（7bおよび13b）は、アーキテクチャ、データ、またはトレーニング方法の進歩を示している以前のOLMOモデルよりも顕著な改善を示しています。 MAP-NEO-7Bとの競争力のある
Olmo-2、特に13Bバージョンは、完全にオープンモデルの中で強力なベースラインであるMAP-NEO-7Bに匹敵するスコアを達成します。

Running OLMo-2 Locally with Gradio and LangChain olmo 2のトレーニング方法

Olmo 2のアーキテクチャは、元のOlmoに基づいて構築されており、安定性とパフォーマンスを改善するための改良を取り入れています。トレーニングプロセスは、2つの段階で構成されています

財団トレーニング： olmo-mix-1124データセット（多様なオープンソースからの約3.9兆トークン）を利用して、言語理解のための堅牢な基盤を確立します。

モデルの知識とスキルを改善するために、高品質のWebデータとドメイン固有のデータ（アカデミックコンテンツ、Q＆Aフォーラム、指導データ、数学ワークブック）のキュレーションされたミックスであるDolmino-Mix-1124データセットを採用しています。「モデルスープ」は、最終的なチェックポイントをさらに強化します
LLMS olmo-2は完全にオープンなモデルであるため、モデルのオープン性の異なるレベルの区別を明確にしましょう。

オープンウェイトモデル：

モデルの重みのみがリリースされます。 Running OLMo-2 Locally with Gradio and LangChain

部分的にオープンモデル：トレーニングプロセスの完全な画像ではありませんが、重みを超えていくつかの追加情報をリリースします。

完全にオープンモデル：

ウェイト、トレーニングデータ、コード、レシピ、チェックポイントなど、完全な透明性を提供します。これにより、完全な再現性が可能になります

olmo 2を局所的に探索して実行しています

Olmo 2はすぐにアクセスできます。モデルとデータをダウンロードするための手順と、トレーニングコードと評価メトリックが利用可能です。 Olmo 2をローカルに実行するには、Ollamaを使用します。インストール後、コマンドラインでollama run olmo2:7bを実行するだけです。必要なライブラリ（LangchainおよびGradio）は、PIPでインストールできます。

olmo 2 でチャットボットを構築します
次のPythonコードは、Olmo 2、Gradio、およびLangchainを使用してチャットボットの構築を示しています。

このコードは、基本的なチャットボットインターフェイスを提供します。この基盤の上に、より洗練されたアプリケーションを構築できます。例の出力とプロンプトは、元の記事に示されています。
import gradio as gr from langchain_core.prompts import ChatPromptTemplate from langchain_ollama.llms import OllamaLLM def generate_response(history, question): template = """Question: {question} Answer: Let's think step by step.""" prompt = ChatPromptTemplate.from_template(template) model = OllamaLLM(model="olmo2") chain = prompt | model answer = chain.invoke({"question": question}) history.append({"role": "user", "content": question}) history.append({"role": "assistant", "content": answer}) return history with gr.Blocks() as iface: chatbot = gr.Chatbot(type='messages') with gr.Row(): with gr.Column(): txt = gr.Textbox(show_label=False, placeholder="Type your question here...") txt.submit(generate_response, [chatbot, txt], chatbot) iface.launch()
ログイン後にコピー

結論

Olmo 2は、オープンソースLLMエコシステムへの重要な貢献を表しています。その強力なパフォーマンスは、完全な透明性と組み合わさって、研究者と開発者にとって貴重なツールになります。すべてのタスクで普遍的に優れているわけではありませんが、そのオープンな性質はコラボレーションを促進し、アクセス可能で透明なAIの分野での進歩を加速します。
キーテイクアウト：

OLMO-2の13Bパラメーターモデルは、さまざまなベンチマークで優れたパフォーマンスを示し、他のオープンモデルよりも優れています。 完全なモデルのオープンネスは、より効果的なモデルの開発を促進します。
チャットボットの例では、LangchainとGradioとの統合の容易さを示しています。

よくある質問（FAQ）
（元の記事のFAQはここに含まれています。）
）
（注：画像URLは変更されていません。）

以上がGradioとLangchainでOLMO-2をローカルに実行しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7915

Java チュートリアル

1652

CakePHP チュートリアル

1411

Laravel チュートリアル

1303

PHP チュートリアル

1248

Related knowledge

クリエイティブプロジェクトのための最高のAIアートジェネレーター（無料＆amp;有料） Apr 02, 2025 pm 06:10 PM

この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

ベストAIチャットボットが比較されました（chatgpt、gemini、claude＆amp; more） Apr 02, 2025 pm 06:09 PM

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

10生成AIコーディング拡張機能とコードのコードを探る必要があります Apr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング！その日はどのようなコーディング関連のタスクを計画していますか？このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。終わり？ - ＆＃8217を見てみましょう

トップAIライティングアシスタントは、コンテンツの作成を後押しします Apr 02, 2025 pm 06:11 PM

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します