ホームページ テクノロジー周辺機器 AI GradioとLangchainでOLMO-2をローカルに実行します

GradioとLangchainでOLMO-2をローカルに実行します

Mar 06, 2025 am 10:55 AM

olmo 2:アクセス可能なAI

のための強力なオープンソースLLM

自然言語処理の分野(NLP)は、特に大規模な言語モデル(LLM)で急速に進歩しています。独自のモデルは歴史的に支配的でしたが、オープンソースの代替品は急速にギャップを埋めています。 Olmo 2は、完全な透明性とアクセシビリティを維持しながら、閉鎖モデルに匹敵するパフォーマンスを提供し、パフォーマンスを提供します。この記事は、トレーニング、パフォーマンス、および実用的なアプリケーションを調査し、Olmo 2を掘り下げています。

キー学習ポイント:

    オープンソースLLMSとOLMO 2のAI研究への貢献の重要性を把握してください。
  • Olmo 2のアーキテクチャ、トレーニング方法、およびベンチマークの結果を理解してください
  • オープンウェイト、部分的に開いた、完全に開いたモデルアーキテクチャを区別します。
  • GradioとLangchainを使用して地元でOlmo 2を実行することを学ぶ。
  • Pythonコードの例を使用してOlmo 2を使用してチャットボットアプリケーションを作成します。
  • (この記事はデータサイエンスブログの一部です。)
目次:

オープンソースLLMSの必要性

olmo 2の紹介 Olmo 2のトレーニングの分解

    Olmo 2の機能を探る
  • Olmo 2
  • とのチャットボットの構築
  • 結論
  • よくある質問
  • オープンソースLLMSの需要
  • 独自のLLMの最初の支配は、アクセシビリティ、透明性、バイアスに関する懸念を引き起こしました。 オープンソースLLMSは、コラボレーションを促進し、精査、修正、改善を可能にすることにより、これらの問題に対処します。 このオープンアプローチは、分野を進め、LLMテクノロジーへの公平なアクセスを確保するために不可欠です。
AI(AI2)のOLMOプロジェクトのためのアレン研究所は、このコミットメントを実証しています。 Olmo 2は、単にモデルの重みをリリースするだけではありません。トレーニングデータ、コード、トレーニングレシピ、中級チェックポイント、命令チューニングモデルを提供します。この包括的なリリースは、再現性とさらなるイノベーションを促進します

olmo 2

を理解しています

Olmo 2は、その前身であるOlmo-0424を大幅に改善します。 7Bおよび13Bパラメーターモデルは、英語のアカデミックベンチマークでLlama 3.1のようなオープンウェイトモデルに匹敵する、またはそれを超えるパフォーマンスを示しています。

重要な改善には、次のものが含まれます

  • 実質的なパフォーマンスの向上:Olmo-2(7bおよび13b)は、アーキテクチャ、データ、またはトレーニング方法の進歩を示している以前のOLMOモデルよりも顕著な改善を示しています。 MAP-NEO-7Bとの競争力のある
  • Olmo-2、特に13Bバージョンは、完全にオープンモデルの中で強力なベースラインであるMAP-NEO-7Bに匹敵するスコアを達成します。

Running OLMo-2 Locally with Gradio and LangChainolmo 2のトレーニング方法

Olmo 2のアーキテクチャは、元のOlmoに基づいて構築されており、安定性とパフォーマンスを改善するための改良を取り入れています。 トレーニングプロセスは、2つの段階で構成されています

財団トレーニング: olmo-mix-1124データセット(多様なオープンソースからの約3.9兆トークン)を利用して、言語理解のための堅牢な基盤を確立します。

    洗練と専門化:
  1. モデルの知識とスキルを改善するために、高品質のWebデータとドメイン固有のデータ(アカデミックコンテンツ、Q&Aフォーラム、指導データ、数学ワークブック)のキュレーションされたミックスであるDolmino-Mix-1124データセットを採用しています。 「モデルスープ」は、最終的なチェックポイントをさらに強化します
  2. LLMS olmo-2は完全にオープンなモデルであるため、モデルのオープン性の異なるレベルの区別を明確にしましょう。
オープンウェイトモデル:

モデルの重みのみがリリースされます。Running OLMo-2 Locally with Gradio and LangChain

部分的にオープンモデル:トレーニングプロセスの完全な画像ではありませんが、重みを超えていくつかの追加情報をリリースします。

完全にオープンモデル:

ウェイト、トレーニングデータ、コード、レシピ、チェックポイントなど、完全な透明性を提供します。 これにより、完全な再現性が可能になります

    主要な違いを要約するテーブルを以下に示します。
  • olmo 2を局所的に探索して実行しています

    Olmo 2はすぐにアクセスできます。 モデルとデータをダウンロードするための手順と、トレーニングコードと評価メトリックが利用可能です。 Olmo 2をローカルに実行するには、Ollamaを使用します。 インストール後、コマンドラインでollama run olmo2:7bを実行するだけです。 必要なライブラリ(LangchainおよびGradio)は、PIPでインストールできます。

    olmo 2 でチャットボットを構築します

    次のPythonコードは、Olmo 2、Gradio、およびLangchainを使用してチャットボットの構築を示しています。

    このコードは、基本的なチャットボットインターフェイスを提供します。 この基盤の上に、より洗練されたアプリケーションを構築できます。 例の出力とプロンプトは、元の記事に示されています。
    import gradio as gr
    from langchain_core.prompts import ChatPromptTemplate
    from langchain_ollama.llms import OllamaLLM
    
    def generate_response(history, question):
        template = """Question: {question}
    
        Answer: Let's think step by step."""
        prompt = ChatPromptTemplate.from_template(template)
        model = OllamaLLM(model="olmo2")
        chain = prompt | model
        answer = chain.invoke({"question": question})
        history.append({"role": "user", "content": question})
        history.append({"role": "assistant", "content": answer})
        return history
    
    with gr.Blocks() as iface:
        chatbot = gr.Chatbot(type='messages')
        with gr.Row():
            with gr.Column():
                txt = gr.Textbox(show_label=False, placeholder="Type your question here...")
        txt.submit(generate_response, [chatbot, txt], chatbot)
    
    iface.launch()
    ログイン後にコピー

    Running OLMo-2 Locally with Gradio and LangChainRunning OLMo-2 Locally with Gradio and LangChain Running OLMo-2 Locally with Gradio and LangChainRunning OLMo-2 Locally with Gradio and LangChain結論

    Olmo 2は、オープンソースLLMエコシステムへの重要な貢献を表しています。 その強力なパフォーマンスは、完全な透明性と組み合わさって、研究者と開発者にとって貴重なツールになります。 すべてのタスクで普遍的に優れているわけではありませんが、そのオープンな性質はコラボレーションを促進し、アクセス可能で透明なAIの分野での進歩を加速します。

    キーテイクアウト:

    OLMO-2の13Bパラメーターモデルは、さまざまなベンチマークで優れたパフォーマンスを示し、他のオープンモデルよりも優れています。 完全なモデルのオープンネスは、より効果的なモデルの開発を促進します。

    チャットボットの例では、LangchainとGradioとの統合の容易さを示しています。
    • よくある質問(FAQ)
    • (元の記事のFAQはここに含まれています。)
    • (注:画像URLは変更されていません。)

以上がGradioとLangchainでOLMO-2をローカルに実行しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

クリエイティブプロジェクトのための最高のAIアートジェネレーター(無料&有料) クリエイティブプロジェクトのための最高のAIアートジェネレーター(無料&有料) Apr 02, 2025 pm 06:10 PM

この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

Meta Llama 3.2を始めましょう - 分析Vidhya Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

ベストAIチャットボットが比較されました(chatgpt、gemini、claude& more) ベストAIチャットボットが比較されました(chatgpt、gemini、claude& more) Apr 02, 2025 pm 06:09 PM

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

10生成AIコーディング拡張機能とコードのコードを探る必要があります 10生成AIコーディング拡張機能とコードのコードを探る必要があります Apr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

トップAIライティングアシスタントは、コンテンツの作成を後押しします トップAIライティングアシスタントは、コンテンツの作成を後押しします Apr 02, 2025 pm 06:11 PM

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します

従業員へのAI戦略の販売:Shopify CEOのマニフェスト 従業員へのAI戦略の販売:Shopify CEOのマニフェスト Apr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5など AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5など Apr 11, 2025 pm 12:01 PM

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

最高のAI音声ジェネレーターの選択:レビューされたトップオプション 最高のAI音声ジェネレーターの選択:レビューされたトップオプション Apr 02, 2025 pm 06:12 PM

この記事では、Google Cloud、Amazon Polly、Microsoft Azure、IBM Watson、DecriptなどのトップAI音声ジェネレーターをレビューし、機能、音声品質、さまざまなニーズへの適合性に焦点を当てています。

See all articles