Einführung
In den letzten Jahren hat der Bereich der künstlichen Intelligenz große Fortschritte gemacht. Mit der zunehmenden Verbreitung künstlicher Intelligenz müssen Entwickler Wege finden, KI in ihre Anwendungen zu integrieren. Gemini bietet JavaScript-Entwicklern einen bequemen KI-Entwicklungspfad über das GoogleGenerativeAI-Paket von Node. Entwickler können auf die von Google DeepMind entwickelten Gemini-Modelle zugreifen, um mithilfe von KI spannende Funktionen zu erstellen. Python- oder GO-Benutzer können andere Pakete verwenden, und Gemini bietet auch eine RESTful-API. In diesem Artikel werden die Verbesserungen besprochen, die das neueste Modell von Gemini mit sich bringt, und wie Sie mit der Verwendung des GoogleGenerativeAI-Pakets von Node beginnen können.
Hauptfortschritt
Eine wesentliche Verbesserung im Gemini 1.5 Flash-Modell ist die Möglichkeit, die Anzahl der Kontext-Tags in einer einzigen Anfrage zu verarbeiten. In der Vergangenheit waren solche Modelle durch die Menge an Text oder Markup begrenzt, die gleichzeitig verarbeitet werden konnte. In den letzten Jahren erstellte generative Modelle können jeweils nur 8.000 Tags verarbeiten. Obwohl sich diese Zahl mit der Weiterentwicklung der KI-Technologie verbessert hat, bleibt sie ein begrenzender Faktor. Heute ist Gemini 1.5 Flash in der Lage, bis zu 1 Million Tags gleichzeitig zu verarbeiten. Die professionelle Version (Gemini 1.5 Pro) kann bis zu 2 Millionen Marker verarbeiten. Dadurch kann Gemini große Informationsmengen auf einmal verarbeiten und dabei eine sehr hohe Genauigkeit beibehalten. Mehr über die Fortschritte von Gemini in der künstlichen Intelligenz und ihre Bedeutung können Sie hier lesen.
Erste Schritte
Um das GoogleGenerativeAI-Paket verwenden zu können, müssen Sie zunächst einen Gemini-API-Schlüssel erstellen. Es ist ein schneller und einfacher Vorgang.
Nachdem Sie auf den API-Schlüssel zugegriffen haben, müssen Sie das Paket mit Node installieren.
npm install @google/generative-ai
Sobald Sie dies alles erledigt haben, können Sie mit der Entwicklung mit KI beginnen!
Einstellungen
Importieren Sie das Paket in die Datei, in der Sie es verwenden möchten.
<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai'; // 或 const { GoogleGenerativeAI } = require('@google/generative-ai');</code>
Erstellen Sie eine GoogleGenerativeAI-Instanz und übergeben Sie Ihren API-Schlüssel.
<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>
Verwenden Sie die Methode getGenerativeModel und übergeben Sie das Modellobjekt, das Sie verwenden möchten. Es stehen mehrere Modelle zur Verfügung. In diesem Beispiel wird das Gemini 1.5 Flash-Modell verwendet. Zwillingsmodell
<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>
Sobald Sie Ihr Modell eingerichtet haben, können Sie mithilfe der KI Text generieren, auf Bilder reagieren, Informationen aus Videos extrahieren und vieles mehr.
Konfigurations- und Systembefehle
Sie können optional Konfigurations- und Systemanweisungen für Ihr Modell bereitstellen. Die Konfiguration wird auf die Eigenschaft „generationConfig“ im Methodenaufruf „generateContent“ angewendet. Einige Konfigurationsoptionen umfassen:
Weitere generationConfig-Eigenschaften finden Sie hier. Die Bereitstellung von Systemanweisungen kann dazu beitragen, die Antworten zu verbessern, indem der KI mehr Kontext gegeben wird. Darüber hinaus werden Modelle individuellere Antworten generieren und besser auf Benutzerbedürfnisse eingehen können. Geben Sie beim Initialisieren des Modells Systemanweisungen an.
<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai'; // 或 const { GoogleGenerativeAI } = require('@google/generative-ai');</code>
Textgenerierung
Es gibt mehrere Möglichkeiten, mit diesem Paket Text zu generieren. Die einfachste Methode besteht darin, einfach den Modelltext einzugeben, es gibt jedoch spannendere und komplexere Möglichkeiten, Text zu generieren. Sie können dem Modell Bilder und Text zur Verfügung stellen, damit die KI auf die Bilder reagiert. Hier ist ein einfaches Beispiel für eine Anfrage, die nur Text verwendet, um eine Antwort zu generieren. Die Modelleinstellungen sind in diesem Codeblock nicht enthalten, aber dennoch Teil des Codes.
<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>
Die Eingabeaufforderungszeichenfolge wird an die Methode „generateContent“ des Modells übergeben. Nachdem die Antwort zurückgegeben wurde, können Sie in der Textmethode der Antworteigenschaft auf die Antwort zugreifen. Das Ergebnis dieser Reaktion: „Die Mondoberfläche ist mit einer Schicht Feinstaub namens Regolith bedeckt, der über Milliarden von Jahren durch Mikrometeoriteneinschläge entsteht. Dieser Staub ist so fein, dass er an allem haften bleibt, was für Astronauten sehr wichtig ist.“ und Mondausrüstung stellen eine Herausforderung dar, oder? Dies ist ein super einfaches Beispiel, aber es gibt noch viel mehr Möglichkeiten.
Text-Streaming und Chat
Das Modell wartet darauf, den gesamten Antworttext zu generieren, bevor es die Antwort zurückgibt. Es ist offensichtlich, oder? Wenn Sie nicht auf die Generierung der gesamten Antwort warten möchten, können Sie Text-Streaming verwenden, um eine schnellere Antwort zu erhalten, indem Sie nicht auf das gesamte Ergebnis warten müssen. Dies kann mit der streamGenerateContent-Methode erreicht werden. Hier ist ein Beispiel aus der Gemini-API-Dokumentation.
<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>
Das Paket bietet auch die Möglichkeit, Gespräche zu verfolgen. „Ermöglicht Benutzern, Schritt für Schritt Antworten zu finden“, was Benutzern bei der Lösung mehrstufiger Probleme hilft. Dies ist eine relativ fortgeschrittene Funktion der Gemini-API. Weitere Informationen zum Erstellen von Chats und anderen Funktionen zur Textgenerierung finden Sie in der Gemini-API-Dokumentation.
Fazit
Das GoogleGenerativeAi-Paket ermöglicht JavaScript-Entwicklern die einfache Integration ihrer Anwendungen in die KI-Technologie. Das Paket verfügt über eine Vielzahl von Funktionen zur KI-Generierung, darunter Text, Video und Bilder. Die Fähigkeit der Zwillinge, große Textmengen auf einmal zu verarbeiten, ist eine wichtige Entwicklung in der KI-Generierung. Mit GoogleGenerativeAI for Node können Entwickler fortschrittliche KI-Technologie einfacher in ihre Projekte integrieren.
Quelle
NPM DeepMind Zwillinge langer Kontext
Das obige ist der detaillierte Inhalt vonGoogleGenerativeAI von Node: Integration von KI-Technologie in JavaScript. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!