ホームページ > テクノロジー周辺機器 > AI > Microsoft、言語モデルの推論機能を強化する XOT テクノロジーを発表

Microsoft、言語モデルの推論機能を強化する XOT テクノロジーを発表

王林
リリース: 2023-11-17 17:45:20
転載
1143 人が閲覧しました

微软推出 XOT 技术,加强语言模型的推理能力

11 月 15 日のニュース、マイクロソフトは最近、Google DeepMind の AlphaZero に触発された「Everything of Thought」 (XOT) と呼ばれる手法を開始しました。 コンパクトなニューラル ネットワークを使用して、推論能力を強化しますAIモデルの。

微软推出 XOT 技术,加强语言模型的推理能力

微软推出 XOT 技术,加强语言模型的推理能力

微软推出 XOT 技术,加强语言模型的推理能力

マイクロソフトは、ジョージア工科大学および華東師範大学と協力して、アルゴリズム 、強化学習 (強化学習) とモンテカルロ木検索 (MCTS) 機能を統合し、複雑な意思決定環境における問題解決の有効性をさらに向上させます。

このサイトからの注: Microsoft 研究チームは、XOT メソッドはなじみのない問題に対して言語モデルを拡張でき、Game of 24、8-Puzzle、Pocket Cube の厳密なテストで大幅に改善されたと述べています。結果は、XOT が他の方法よりも大幅に優れており、他の方法が失敗する問題も解決できることを示しています。ただし、XOT は 100% の信頼性を達成するわけではありません

微软推出 XOT 技术,加强语言模型的推理能力

#XOT フレームワークには次の重要な手順が含まれています:

    事前トレーニング フェーズ: MCTS モジュール効果的なメンタルサーチに関する専門知識を学ぶためのタスクに関する事前トレーニング。軽量ポリシーとバリュー ネットワークに基づく検索。アイデア検索: 推論中、事前トレーニングされた MCTS モジュールはポリシー/値ネットワークを使用して、LLM のアイデアの軌跡を効率的に探索および生成します。
  • 思考の修正: LLM は MCTS の思考をレビューし、誤りを特定します。改訂のアイデアは、追加の MCTS シミュレーションを通じて生成されました。
  • LLM 推論: 問題解決の最終ヒントとして、修正されたアイデアを LLM に提供します。
この Web サイトには論文のアドレス [

PDF] が添付されています。興味のあるユーザーは詳細を読むことができます。

以上がMicrosoft、言語モデルの推論機能を強化する XOT テクノロジーを発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート