マルチモーダルAIエージェントを使用して、製品成分の秘密のロックを解除してください! 複雑な成分リストを解読するのにうんざりしていませんか?この記事では、Gemini 2.0、Phidata、およびTavily Web検索を使用して、強力な製品成分アナライザーを構築する方法について説明します。 時間のかかる個々の成分の検索に別れを告げ、インスタントの実用的な洞察にこんにちは!
ビジョン言語タスクのためにPhidataとGemini 2.0を活用するマルチモーダルAIエージェントアーキテクチャの設計。
エージェントワークフロー内の強化されたコンテキストと情報の検索のタビリーWeb検索の統合。マルチモーダルシステムの理解 実際のマルチモーダルアプリケーション マルチモーダルエージェントの力
製品成分アナライザーエージェントの構築 必須リンク
財務:スクリーンショットを撮るだけで複雑な金融条件を即座に理解します。
eコマース:
製品ラベルを撮影して、詳細な成分分析と健康の洞察を取得します。教育:教科書からの複雑な図と概念の簡略化された説明を得る。
Healthcare:
製品成分分析エージェントを段階的に構築しましょう
ステップ1:依存関係のセットアップ
必要なのは
です gemini 2.0フラッシュ:強力なマルチモーダル処理用。
タビリー検索:シームレスなWeb検索統合のため。
!pip install phidata google-generativeai tavily-python streamlit pillow
tavily apiキー:
https://www.php.cn/link/c73ff6dceadedf3652d678cd790ff167from phi.agent import Agent from phi.model.google import Gemini # needs a api key from phi.tools.tavily import TavilyTools # also needs a api key import os TAVILY_API_KEY = "<replace-your-api-key>" GOOGLE_API_KEY = "<replace-your-api-key>" os.environ['TAVILY_API_KEY'] = TAVILY_API_KEY os.environ['GOOGLE_API_KEY'] = GOOGLE_API_KEY</replace-your-api-key></replace-your-api-key>
Phidataエージェントは、マークダウンを処理し、システムプロンプトと命令に基づいて動作するように構成されています。 Gemini 2.0フラッシュは推論モデルとして使用され、効率的なWeb検索のためにTavily Searchが統合されています。
ステップ5:マルチモーダル画像処理
SYSTEM_PROMPT = """ You are an expert Food Product Analyst specialized in ingredient analysis and nutrition science. Your role is to analyze product ingredients, provide health insights, and identify potential concerns by combining ingredient analysis with scientific research. You utilize your nutritional knowledge and research works to provide evidence-based insights, making complex ingredient information accessible and actionable for users. Return your response in Markdown format. """ INSTRUCTIONS = """ * Read ingredient list from product image * Remember the user may not be educated about the product, break it down in simple words like explaining to 10 year kid * Identify artificial additives and preservatives * Check against major dietary restrictions (vegan, halal, kosher). Include this in response. * Rate nutritional value on scale of 1-5 * Highlight key health implications or concerns * Suggest healthier alternatives if needed * Provide brief evidence-based recommendations * Use Search tool for getting context """
分析を開始するために、画像パスまたはURLをプロンプトとともに提供します。 両方のアプローチを使用した例は、元の記事で提供されています。 ステップ6&7:Webアプリ開発を合理化する
(元の記事の詳細なコード)retrylitアプリケーションが作成され、画像のアップロード、分析、および結果表示用のユーザーフレンドリーなインターフェイスが提供されます。 アプリには、製品、画像のアップロード、ライブ写真キャプチャなどのタブが含まれています。 最適なパフォーマンスのために、画像のサイズ変更とキャッシュが実装されています
agent = Agent( model = Gemini(), tools = [TavilyTools()], markdown=True, system_prompt = SYSTEM_PROMPT, instructions = INSTRUCTIONS )
本質的なリンク
完全なコード:[GitHubリンクをこちらに挿入]
展開アプリ:[ここに展開されたアプリリンクを挿入]
結論
マルチモーダルAIエージェントは、複雑な情報との対話と理解をどのように変換し、理解しています。 製品成分アナライザーは、ビジョン、言語、およびWeb検索を組み合わせて、アクセス可能で実用的な洞察を提供する力を示しています。
よくある質問
以上が製品成分分析のためのマルチモーダルエージェントを構築しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。