multimodale Agentensysteme stellen einen revolutionären Fortschritt auf dem Gebiet der künstlichen Intelligenz dar und kombinieren nahtlos verschiedene Datentypen - wie Text, Bilder, Audio und Video - ein einheitliches System, das die Fähigkeiten intelligenter Technologien erheblich verbessert. Diese Systeme stützen sich auf autonome intelligente Agenten, die Informationen aus verschiedenen Quellen unabhängig verarbeiten, analysieren und synthetisieren können, was ein tieferes und nuancierteres Verständnis komplexer Situationen erleichtert.
Durch das Zusammenführen multimodaler Eingaben mit agentenfunktionalität können sich diese Systeme in Echtzeit dynamisch an sich ändernde Umgebungen und Benutzerinteraktionen anpassen und eine reaktionsfähigere und intelligentere Erfahrung bieten. Diese Fusion steigert nicht nur die betriebliche Effizienz in einer Reihe von Branchen, sondern erhöht auch die Wechselwirkungen zwischen Mensch und Komputer, wodurch sie flüssiger, intuitiver und kontextuell bewusst werden. Infolgedessen sollen multimodale agentenrahmen die Art und Weise, wie wir mit Technologie interagieren und sie nutzen, um die Innovationen in unzähligen Anwendungen in den Bereichen zu steuern.
Dieser Artikel wurde als Teil des Data Science -Blogathon veröffentlicht.
Agenten -KI -Systeme, die mit ausgefeilten Bildanalysefunktionen befestigt sind, transformieren die Industrien, indem sie eine Reihe unverzichtbarer Funktionen ermöglichen.
Crewai ist ein hochmoderndes Open-Source-Framework, das autonome AI-Agenten in kohärente Teams orchestrieren soll, um komplexe Aufgaben gemeinsam anzugehen. Innerhalb von Crewai wird jedem Agenten spezifische Rollen zugewiesen, die mit festgelegten Werkzeugen ausgestattet und von gut definierten Zielen angetrieben werden, die die Struktur einer realen Arbeitskrewe widerspiegeln.
Das Vision-Tool erweitert die Funktionen von Crewai und ermöglicht es den Agenten, bildbasierte Textdaten zu verarbeiten und zu verstehen und so visuelle Informationen in ihre Entscheidungsprozesse zu integrieren. Agenten können das Vision -Tool nutzen, um Text aus Bildern zu extrahieren, indem sie einfach eine URL oder einen Dateipfad bereitstellen und ihre Fähigkeit verbessern, Informationen aus verschiedenen Quellen zu sammeln. Nachdem der Text extrahiert wurde, können Agenten diese Informationen dann verwenden, um umfassende Antworten oder detaillierte Berichte zu generieren, die Workflows weiter zu automatisieren und die Gesamteffizienz zu verbessern. Um das Vision -Tool effektiv zu verwenden, ist es erforderlich, den OpenAI -API -Schlüssel innerhalb der Umgebungsvariablen festzulegen, um eine nahtlose Integration in Sprachmodelle zu gewährleisten.
Wir werden ein ausgeklügeltes, multimodales Agentensystem erstellen, das das Vision-Tool von Crewai zunächst nutzen wird, um Aktiendiagramme (als Bilder) zweier Unternehmen zu interpretieren und zu analysieren. Dieses System wird dann die Macht des Deepseek-R1-Distill-Qwen-7b-Modells nutzen, um detaillierte Erklärungen für das Verhalten dieser Unternehmen zu liefern und gut begründete Einblicke in die Leistung der beiden Unternehmen zu bieten und ihr Verhalten zu vergleichen. Dieser Ansatz ermöglicht ein umfassendes Verständnis und Vergleich von Markttrends durch Kombination der visuellen Datenanalyse mit fortschrittlichen Sprachmodellen, wodurch fundierte Entscheidungen ermöglicht werden.
Um die erweiterten Argumentationsfähigkeiten von Deepseek R1 für den Einsatz in kompakteren Sprachmodellen anzupassen, haben die Ersteller einen Datensatz mit 800.000 Beispielen zusammengestellt, die von Deepseek R1 selbst generiert wurden. Diese Beispiele wurden dann verwendet, um vorhandene Modelle wie Qwen und Lama zu optimieren. Die Ergebnisse zeigten, dass diese relativ einfache Wissensdestillationsmethode die ausgefeilten Argumentationsfunktionen von R1 effektiv auf diese anderen Modelle
übertragen hatDas Deepseek-R1-Distill-Qwen-7b-Modell ist eines der Modelle des destillierten Deepseek R1. Es handelt sich um eine destillierte Version der größeren Deepseek-R1-Architektur, die eine verbesserte Effizienz bietet und gleichzeitig eine robuste Leistung aufrechterhält. Hier sind einige wichtige Funktionen:
Das Modell zeichnet sich in mathematischen Aufgaben aus und erzielt eine beeindruckende Punktzahl von 92,8% auf dem Math-500-Benchmark, wobei seine Fähigkeit demonstriert, das komplexe mathematische Denken effektiv zu bewältigen.
Zusätzlich zu seiner mathematischen Fähigkeiten spielt die Deepseek-R1-Distill-Qwen-7b bei sachlichen Fragen-Answer-Aufgaben einigermaßen gut ab. Wir werden dieses Modell nutzen, um Argumentationen für das Verhalten von Aktien von Unternehmen nach Extraktion von Informationen aus Aktiendiagrammbildern zu erklären und zu finden.
Python-Implementierung von Python mit Ollama auf Google Colab
!pip install crewai crewai_tools !sudo apt update !sudo apt install -y pciutils !pip install langchain-ollama !curl -fsSL https://ollama.com/install.sh | sh !pip install ollama==0.4.2
import threading import subprocess import time def run_ollama_serve(): subprocess.Popen(["ollama", "serve"]) thread = threading.Thread(target=run_ollama_serve) thread.start() time.sleep(5)
!ollama pull deepseek-r1
import os from crewai import Agent, Task, Crew, Process, LLM from crewai_tools import LlamaIndexTool from langchain_openai import ChatOpenAI from crewai_tools import VisionTool vision_tool = VisionTool() os.environ['OPENAI_API_KEY'] ='' os.environ["OPENAI_MODEL_NAME"] = "gpt-4o-mini" llm = LLM( model="ollama/deepseek-r1", )
def create_crew(image_url,image_url1): #Agent For EXTRACTNG INFORMATION FROM STOCK CHART stockchartexpert= Agent( role="STOCK CHART EXPERT", goal="Your goal is to EXTRACT INFORMATION FROM THE TWO GIVEN %s & %s stock charts correctly """%(image_url, image_url1), backstory="""You are a STOCK CHART expert""", verbose=True,tools=[vision_tool], allow_delegation=False ) #Agent For RESEARCH WHY THE STOCK BEHAVED IN A SPECIFIC WAY stockmarketexpert= Agent( role="STOCK BEHAVIOUR EXPERT", goal="""BASED ON THE PREVIOUSLY EXTRACTED INFORMATION ,RESEARCH ABOUT THE RECENT UPDATES OF THE TWO COMPANIES and EXPLAIN AND COMPARE IN SPECIFIC POINTS WHY THE STOCK BEHAVED THIS WAY . """, backstory="""You are a STOCK BEHAVIOUR EXPERT""", verbose=True, allow_delegation=False,llm = llm ) #Task For EXTRACTING INFORMATION FROM A STOCK CHART task1 = Task( description="""Your goal is to EXTRACT INFORMATION FROM THE GIVEN %s & %s stock chart correctly """%((image_url,image_url1)), expected_output="information in text format", agent=stockchartexpert, ) #Task For EXPLAINING WITH ENOUGH REASONINGS WHY THE STOCK BEHAVED IN A SPECIFIC WAY task2 = Task( description="""BASED ON THE PREVIOUSLY EXTRACTED INFORMATION ,RESEARCH ABOUT THE RECENT UPDATES OF THE TWO COMPANIES and EXPLAIN AND COMPARE IN SPECIFIC POINTS WHY THE STOCK BEHAVED THIS WAY.""", expected_output="Reasons behind stock behavior in BULLET POINTS", agent=stockmarketexpert ) #Define the crew based on the defined agents and tasks crew = Crew( agents=[stockchartexpert,stockmarketexpert], tasks=[task1,task2], verbose=True, # You can set it to 1 or 2 to different logging levels ) result = crew.kickoff() return result
Die folgenden zwei Aktiendiagramme wurden als Eingabe für die Crew
angegeben.
text = create_crew("https://www.eqimg.com/images/2024/11182024-chart6-equitymaster.gif","https://www.eqimg.com/images/2024/03262024-chart4-equitymaster.gif") pprint(text)
Mamaearth's stock exhibited volatility during the year due to internal<br> challenges that led to significant price changes. These included unexpected<br> product launches and market controversies which caused both peaks and<br> troughs in the share price, resulting in an overall fluctuating trend.<br><br>On the other hand, Zomato demonstrated a generally upward trend in its share<br> price over the same period. This upward movement can be attributed to<br> expanding business operations, particularly with successful forays into<br> cities like Bengaluru and Pune, enhancing their market presence. However,<br> near the end of 2024, external factors such as a major scandal or regulatory<br> issues might have contributed to a temporary decline in share price despite<br> the overall positive trend.<br><br>In summary, Mamaearth's stock volatility stems from internal inconsistencies<br> and external controversies, while Zomato's upward trajectory is driven by<br> successful market expansion with minor setbacks due to external events.
Wie aus der endgültigen Ausgabe hervorgeht, hat das Agentensystem eine gute Analyse und einen Vergleich des Aktienkursverhaltens aus den Aktiendiagrammen mit ausreichenden Argumentationen wie einem Streifzug in Städte und der Erweiterung der Geschäftsbetriebe hinter dem Aufwärtstrend des Aktienkurs von Zomatato.
Schauen wir uns das Aktienkursverhalten von Aktienkarten für zwei weitere Unternehmen an - jubilant Food Works & Bikaji Foods International Ltd. für das Jahr 2024.
text = create_crew("https://s3.tradingview.com/p/PuKVGTNm_mid.png","https://images.cnbctv18.com/uploads/2024/12/bikaji-dec12-2024-12-b639f48761fab044197b144a2f9be099.jpg?im=Resize,width=360,aspect=fit,type=normal") print(text)
The stock behavior of Jubilant Foodworks and Bikaji can be compared based on<br> their recent updates and patterns observed in their stock charts.<br><br>Jubilant Foodworks:<br><br>Cup & Handle Pattern: This pattern is typically bullish, indicating that the<br> buyers have taken control after a price decline. It suggests potential<br> upside as the candlestick formation may signal a reversal or strengthening<br> buy interest.<br><br>Breakout Point: The horizontal dashed line marking the breakout point implies<br> that the stock has reached a resistance level and may now test higher<br> prices. This is a positive sign for bulls, as it shows strength in the<br> upward movement.<br><br>Trend Line Trend: The uptrend indicated by the trend line suggests ongoing<br> bullish sentiment. The price consistently moves upwards along this line,<br> reinforcing the idea of sustained growth.<br><br>Volume Correlation: Volume bars at the bottom showing correlation with price<br> movements indicate that trading volume is increasing alongside upward price<br> action. This is favorable for buyers as it shows more support and stronger<br> interest in buying.<br><br>Bikaji:<br><br>Recent Price Change: The stock has shown a +4.80% change, indicating positive<br> momentum in the short term.<br><br>Year-to-Date Performance: Over the past year, the stock has increased by<br> 61.42%, which is significant and suggests strong growth potential. This<br> performance could be attributed to various factors such as market<br> conditions, company fundamentals, or strategic initiatives.<br><br>Time Frame: The time axis spans from January to December 2024, providing a<br> clear view of the stock's performance over the next year.<br><br>Comparison:<br><br>Both companies' stocks are showing upward trends, but Jubilant Foodworks has<br> a more specific bullish pattern (Cup & Handle) that supports its current<br> movement. Bikaji, on the other hand, has demonstrated strong growth over the<br> past year and continues to show positive momentum with a recent price<br> increase. The volume in Jubilant Foodworks correlates well with upward<br> movements, indicating strong buying interest, while Bikaji's performance<br> suggests sustained or accelerated growth.<br><br>The stock behavior reflects different strengths: Jubilant Foodworks benefits<br> from a clear bullish pattern and strong support levels, whereas Bikaji<br> stands out with its year-to-date growth. Both indicate positive<br> developments, but the contexts and patterns differ slightly based on their<br> respective market positions and dynamics.
Wie aus der endgültigen Ausgabe hervorgeht, hat das Agentensystem eine gute Analyse und Vergleich des Aktienkursverhaltens aus den Aktiendiagrammen mit ausgefeilten Erklärungen zu den Trends gegeben
Schlussfolgerungen
Die in diesem Artikel gezeigten Medien sind nicht im Besitz von Analytics Vidhya und wird nach Ermessen des Autors verwendet.
häufig gestellte FragenQ2. Was ist Crew ai? Ans. Die Crew AI ist ein fortschrittliches Open-Source-Rahmen, das autonome AI-Agenten in zusammenhängenden Teams koordinieren soll, die zusammenarbeiten, um komplexe Aufgaben zu erledigen. Jedem Agenten im System wird eine bestimmte Rolle zugewiesen, die mit bestimmten Tools ausgestattet und durch genau definierte Ziele angetrieben wird, um die Struktur und Funktion einer realen Arbeitsmannschaft nachzuahmen.
Q3. Wie verbessert das Crew AI Vision Tool multimodale Systeme?
Ans. Das Crew AI Vision -Tool ermöglicht es den Agenten, Text aus Bildern zu extrahieren und zu verarbeiten. Diese Fähigkeit ermöglicht es dem System, visuelle Daten zu verstehen und sie in Entscheidungsprozesse zu integrieren, wodurch die Effizienz der Workflow weiter verbessert wird.
Q4. Welche Branchen können von Agenten -KI -Systemen mit Bildanalysefunktionen profitieren?Ans. Diese Systeme sind besonders in Branchen wie Gesundheitswesen, Fertigung und Einzelhandel von Vorteil, in denen Echtzeitanalysen und Präzision bei der Bilderkennung für Aufgaben wie medizinische Diagnose und Qualitätskontrolle von entscheidender Bedeutung sind.
Q5. Was sind die destillierten Modelle von Deepseek R1?Ans. Die destillierten Modelle von Deepseek-R1 sind kleinere, effizientere Versionen des größeren Deekseek-R1-Modells, das mit einem Prozess namens Destillation erstellt wurde, der einen Großteil der Argumentationsleistung des ursprünglichen Modells bewahrt und gleichzeitig die Rechenanforderungen reduziert. Diese destillierten Modelle werden unter Verwendung von Daten, die von Deepseek-R1 erzeugt wurden, fein abgestimmt. Einige Beispiele dieser destillierten Modelle sind Deepseek-R1-Distill-Qwen-1.5b, Deepseek-R1-Distill-Qwen-7b, Deepseek-R1-Distill-Qwen-14b, Deepseek-r1-Distill-Llama-8b unter anderem.
Das obige ist der detaillierte Inhalt vonWie baue ich ein multimodales Agentensystem für Aktienerkenntnisse?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!