引言
近年來,人工智慧領域取得了長足進展。隨著人工智慧的日益普及,開發者必須找到將AI整合到其應用程式中的方法。 Gemini 透過 Node 的 GoogleGenerativeAI 套件,為 JavaScript 開發者提供了一種便利的 AI 開發途徑。開發者可以存取由 Google DeepMind 開發的 Gemini 模型,從而利用 AI 創建令人興奮的功能。 Python 或 GO 使用者可以使用其他軟體包,Gemini 也提供 RESTful API。本文將討論 Gemini 最新模型帶來的改進,以及如何使用 Node 的 GoogleGenerativeAI 套件入門。
主要進展
Gemini 1.5 Flash 模型的一項重大改進是能夠處理單一請求中的上下文標記數量。過去,此類模型受到一次可以處理的文字或標記數量的限制。過去幾年創建的生成模型一次只能處理 8000 個標記。雖然隨著人工智慧技術的進步,這個數字有所提高,但它仍然是一個限制因素。如今,Gemini 1.5 Flash 能夠一次處理多達 100 萬個標記。專業版(Gemini 1.5 Pro)可處理多達 200 萬個標記。這使得 Gemini 能夠一次處理大量訊息,同時保持非常高的準確率。您可以在此處閱讀有關 Gemini 在人工智慧領域取得的進展及其意義的更多資訊。
入門
要使用 GoogleGenerativeAI 套件,首先需要建立一個 Gemini API 金鑰。這是一個快速簡單的過程。
存取 API 金鑰後,需要使用 Node 安裝軟體包。
npm install @google/generative-ai
完成所有這些操作後,您就可以開始使用 AI 進行開發了!
設定
將軟體包匯入您希望使用它的檔案。
<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai'; // 或 const { GoogleGenerativeAI } = require('@google/generative-ai');</code>
建立一個 GoogleGenerativeAI 實例,同時傳入您的 API 金鑰。
<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>
使用 getGenerativeModel 方法並傳入您要使用的模型物件。有多個模型可用,此範例使用 Gemini 1.5 Flash 模型。 Gemini 模型
<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>
設定模型後,您可以使用 AI 生成文字、回應圖像、從影片中提取資訊等等。
設定與系統指令
您可以選擇為模型提供設定和系統指令。配置應用於 generateContent 方法呼叫中的 generationConfig 屬性。一些配置選項包括:
在此處查看更多 generationConfig 屬性。提供系統指令可以通過為 AI 提供更多上下文來幫助改進響應。此外,模型將生成更多自定義響應,並能夠更好地滿足用戶的需求。在初始化模型時提供系統指令。
<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai'; // 或 const { GoogleGenerativeAI } = require('@google/generative-ai');</code>
文本生成
可以使用多種方法使用該軟件包生成文本。最簡單的方法是只為模型提供文本,但還有更多令人興奮和復雜的方法可以生成文本。您可以為模型提供圖像和文本,以便 AI 對圖像做出反應。這是一個僅使用文本生成響應的請求的簡單示例。模型設置未包含在此代碼塊中,但它仍然是代碼的一部分。
<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>
提示字符串被傳遞到模型的 generateContent 方法中。返迴響應後,可以訪問 response 屬性的 text 方法中的響應。此響應的結果是:“月球表面覆蓋著一層稱為風化層的細塵,這是數十億年微隕石撞擊形成的。這種塵埃非常細,會粘在所有東西上,這對宇航員和月球設備構成挑戰。”很酷吧?這是一個超級簡單的例子,但還有更多可能性。
文本流和聊天
模型在返迴響應之前等待生成整個響應文本。很明顯吧?如果您不想等待生成整個響應,您可以使用文本流來通過不等待整個結果來獲得更快的響應。這可以使用 streamGenerateContent 方法實現。以下是 Gemini API 文檔中的一個示例。
<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>
該軟件包還提供跟踪對話的功能。 “允許用戶逐步找到答案”,這有助於用戶解決多步驟問題。這是 Gemini API 的一個相對高級的功能。有關創建聊天和其他文本生成功能的更多信息,請閱讀 Gemini API 文檔。
結論
GoogleGenerativeAi 包使 JavaScript 開發者可以輕鬆地將其應用程序集成到 AI 技術中。該軟件包在 AI 生成方面具有多種功能,包括文本、視頻和圖像。 Gemini 能夠一次處理大量文本的能力是 AI 生成的一項重大發展。借助 Node 的 GoogleGenerativeAI,開發者能夠以更簡單的方式在其項目中包含先進的 AI 技術。
來源
NPM DeepMind Gemini 長上下文
以上是節點&#s googlegenerativeai:將AI技術納入JavaScript的詳細內容。更多資訊請關注PHP中文網其他相關文章!