MicrosoftのTNT-LLM:分類学の生成とテキスト分類の革命
Microsoftは、速度と精度の両方で従来の方法を上回る、分類法の作成とテキスト分類を自動化する画期的なシステムであるTNT-LLMを発表しました。 この革新的なアプローチは、大規模な言語モデル(LLM)の力を活用して、分類剤と分類器の生成を合理化および拡大し、手動介入を最小限に抑えます。 これは、動的で多様なテキストデータの管理が最重要であるBing Copilotのようなアプリケーションにとって特に有益です。 この記事では、効率的なニュース記事クラスタリングのためにGPT-4OとLanggraphを使用したTNT-LLMの実装を示しています。 GPT-4OとLanggraphの詳細については、これらのリソースを参照してください。
Openaiのgpt-4o?
とは何ですか
この初期フェーズでは、テキストドキュメントのサンプルと特定の指示を使用します(たとえば、「ニュース記事をクラスターするために分類法を生成する」)。 LLMは各ドキュメントを要約し、重要な情報を抽出します。 反復改良を通じて、LLMは分類法を構築、修正、および改良し、効果的なニュース記事分類のためのラベルの構造化された階層と説明をもたらします。
出典:wan et al。
フェーズ2:テキスト分類
出典:wan et al。
TNT-LLMの適応性のある性質により、意図の検出やトピックの分類など、さまざまなテキスト分類タスクに適しています。 TNT-llmの利点
tnt-llmは、大規模なテキストマイニングと分類に大きな利点を提供します:APIキーとモデル名の環境変数を設定します:
コアコンセプト:
pip install langgraph langchain langchain_openai
クラスを使用して構造化された生のテキストデータ(記事、チャットログ)。
export AZURE_OPENAI_API_KEY='your_api_key_here' export AZURE_OPENAI_MODEL='your_deployment_name_here' export AZURE_OPENAI_ENDPOINT='deployment_endpoint'
クラスによって管理されている分類された意図またはトピックのクラスター。
単純なTNT-LLMアプリケーションの構築:Doc
TaxonomyGenerationState
ステップ2:ミニバッチの作成:
要約ドキュメントは、並列処理のためにミニバッチに分割されます。
ステップ3:初期分類法を生成:最初のミニバッチから初期分類法が生成されます。
ステップ4:分類法の更新:後続のミニバッチが処理されると、分類法が繰り返し更新されます。
ステップ5:レビュー分類法:最終的な分類法の正確性と関連性についてレビューされています。
ステップ6:Tnt-llmパイプラインをStategraphで調整します:a Stategraphは、さまざまなステップの実行を調整します。
ステップ7:TNT-llmのニュース記事分類法のクラスタリングと表示
TNT-LLMは、大規模なテキストマイニングと分類のための強力で効率的なソリューションを提供します。その自動化機能は、構造化されていないテキストデータの分析に必要な時間とリソースを大幅に削減し、さまざまなドメインでデータ駆動型の意思決定を可能にします。 業界全体のさらなる開発と適用の可能性は実質的です。 さらなるLLMアプリケーション開発に興味がある人には、「Langchainを使用したLLMアプリケーションの開発」に関するコースが推奨されます。
以上がGPT-4OおよびLanggraphチュートリアル:TNT-LLMアプリケーションを構築しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。