大型模型開發工具集已經建立!
需要進行改寫的內容是:作者Richard MacManus
策劃 | 言徵
Web3未能顛覆掉Web2,但新興的大模型開發棧正在讓開發者從「雲原生」時代邁向新的AI技術堆疊。
提示工程師或許不能觸動開發者奔赴大模型的神經,但產品經理或者領導的一句:能不能開發一個“agent”,能不能實現一條“chain”,“使用哪款向量數據庫” ,卻成為了目前各大主流大模型應用公司中驅動技術同學攻克生成AI開發的難點所在。
新興的技術堆疊究竟分為哪幾層?哪裡最棘手?本文將帶領大家一探究竟
1、技術堆疊需要更新了開發者迎來AI工程師時代
在過去的一年裡,出現了一些工具,如LangChain和LlamaIndex,這使得AI應用程式的開發者生態系統開始變得成熟。甚至,現在還有一個術語來形容那些專注於人工智慧開發的人員,也就是「AI工程師」。根據Shawn@swyx Wang的說法,這是「提示工程師」的下一步。他還創建了一張座標圖,形象化了AI工程師在更廣泛的人工智慧生態系統中的位置
圖源:swyx
大型語言模型(LLM)是AI工程師的核心技術。 LangChain和LlamaIndex都是擴充和補充LLM的工具,這絕非巧合。但是,對於這類新的開發人員來說,還有什麼其他工具可用呢?
到目前為止,我看到的LLM堆疊的最佳圖表來自創投公司Andreessen Horowitz(a16z)。以下是它對「LLM app stack」的看法:
圖源:a16z
2、沒錯,最頂層的還是數據
在LLM技術堆疊中,資料是最重要的組成部分,這一點非常明顯。根據a16z的圖表,數據處於最頂層。在LLM中,"嵌入模型"是非常關鍵的領域,你可以從OpenAI、Cohere、Hugging Face或其他數十種LLM選項中進行選擇,其中包括越來越受歡迎的開源LLM
#在使用LLM之前,還需要建立一個「資料管道」。例如,可以將Databricks和Airflow作為兩個範例,或者可以對資料進行「非結構化」處理。這對於資料的周期性也是適用的,可以幫助企業在將資料輸入自訂LLM之前進行資料的「清理」或簡單整理。像Alation這樣的「資料智慧」公司提供這種類型的服務,聽起來有點像IT技術堆疊中更為人所知的「商業智慧」等工具
資料層的最後一部分是近期非常受歡迎的向量資料庫,用於儲存和處理LLM資料。根據微軟的定義,這是一種將資料儲存為高維向量的資料庫,高維向量是特徵或屬性的數學表示。資料使用嵌入技術儲存為向量
在一次媒體交談中,領先的向量資料庫供應商Pinecone指出,他們的工具經常與資料管道工具(如Databricks)一起使用。在這種情況下,資料通常儲存在其他地方(例如資料湖),然後透過機器學習模型轉換為嵌入式資料。經過處理和分塊後,生成的向量會被發送到Pinecone
3、提示和查詢
接下來的兩個層次可以總結為提示和查詢- 這是人工智慧應用程式與LLM和(可選)其他資料工具介面的交互點。 A16z將LangChain和LlamaIndex定位為“編排框架”,這意味著一旦開發人員了解他們使用的是哪種LLM,就可以利用這些工具
根據a16z的觀點,像LangChain和LlamaIndex這樣的編排框架“抽象掉了許多提示連結的細節”,這意味著在應用程式和LLM之間查詢和管理資料。這個編排過程包括與外部API介面的交互,從向量資料庫中檢索上下文數據,以及在多個LLM呼叫中維護記憶體。 a16z圖表中最有趣的方框是“遊樂場”,其中包括OpenAI、nat.dev和Humanloop
A16z在部落格文章中沒有確切定義,但我們可以推斷,“遊樂場”工具可以幫助開發者施展A16z所說的「提示柔術」。在這些地方,開發人員可以嘗試各種提示技術。
Humanloop是一家英國公司,其平台的一個功能是「協作提示工作區」。它進一步將自己描述為「用於生產LLM功能的完整開發工具包」。因此,基本上,它允許您嘗試LLM的東西,然後將其部署到應用程式中(如果它有效的話)
4、管線作業:LLMOps
目前,大型生產管線的佈局正在逐漸明確。在編排框的右側,有許多操作框,其中包括LLM快取和驗證。此外,還有一系列與LLM相關的雲端服務和API服務,其中包括Hugging Face等開放的API儲存庫,以及OpenAI等專有的API供應商
這可能是我們在“雲端原生”時代習慣的開發人員技術堆疊中最相似的地方,許多DevOps公司將人工智慧添加到了他們的產品清單中,這絕非巧合。 5月,我與Harness執行長Jyoti Bansal進行了交談。 Harness運行一個“軟體交付平台”,專注於CI/CD流程的“CD”部分。
Bansai告訴我,人工智慧可以減輕軟體交付生命週期中涉及的繁瑣和重複的任務,從基於現有功能生成規範到編寫程式碼。此外,他還表示,人工智慧可以自動化程式碼審查、漏洞測試、錯誤修復,甚至為建置和部署創建CI/CD管道。根據我在五月的另一次對話,人工智慧也在改變開發人員的生產力。來自建立自動化工具Gradle的Trisha Gee告訴我,人工智慧可以透過減少重複任務(如編寫樣板程式碼)的時間來加速開發,並使開發人員能夠專注於大局,例如確保程式碼滿足業務需求。
5、Web3涼了,大模型開發堆疊來了
在新興的LLM開發技術堆疊中,我們可以觀察到一系列新的產品類型,例如編排框架(如LangChain和LlamaIndex)、向量資料庫和Humanloop等「遊樂場」平台。所有這些產品都在擴展和/或補充當前時代的核心技術:大型語言模型
一如前幾年Spring Cloud、Kubernetes等雲端原生時代工具的興起。只不過當下,幾乎所有雲端原生時代的大、小、頂流企業都在極力將其工具適應AI工程化,這會對LLM技術棧的未來發展非常有利。
沒錯,這次的大模型儼然“站在巨人的肩膀上”,電腦技術中最好的創新總是建立在以前的基礎上。也許這就是「Web3」革命失敗的原因——與其說它是建立在上一代的基礎上,不如說它試圖篡奪它。
LLM技術堆疊似乎已經做到了,它成為了從雲端開發時代到更新的、基於人工智慧的開發者生態系統的橋樑
參考連結:https:/ /www.php.cn/link/c589c3a8f99401b24b9380e86d939842
#以上是大型模型開發工具集已經建立!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

火山引擎總裁譚待企業要做好大模型落地,面臨模型效果、推理成本、落地難度的三大關鍵挑戰:既要有好的基礎大模型做支撐,解決複雜難題,也要有低成本的推理服務讓大模型廣泛應用,還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地,位元組跳動自主研發的豆包大模型將透過火山

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年,正是大模型盛行的時期,很多企業認為已經大模型之後圖譜的重要性大大降低了,之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行,我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提,因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展,其中有許多技巧和方法可以挖掘。可見一個新技術的出現,並不是將所有的舊技術打敗,也有可能將新技術和舊技術相互融合後

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

6月13日消息,根據字節旗下「火山引擎」公眾號介紹,小米旗下人工智慧助理「小愛同學」與火山引擎達成合作,雙方基於豆包大模型實現更智慧的AI互動體驗。據悉,位元組跳動打造的豆包大模型,每日能夠高效處理數量多達1200億個的文本tokens、生成3000萬張內容。小米借助豆包大模型提升自身模型的學習與推理能力,打造出全新的“小愛同學”,不僅更加精準地把握用戶需求,還以更快的響應速度和更全面的內容服務。例如,當使用者詢問複雜的科學概念時,&ldq

評估Java框架商業支援的性價比涉及以下步驟:確定所需的保障等級和服務等級協定(SLA)保證。研究支持團隊的經驗和專業知識。考慮附加服務,如昇級、故障排除和效能最佳化。權衡商業支援成本與風險緩解和提高效率。

目前為止,AI穿戴裝置賽道還沒有任何一個產品取得特別好的成績。今年年初在MWC24橫空出世的AIPin,評樣機一經寄出,發佈時被狂吹的「AI神話」也開始破滅,短短幾個月就經歷了大規模退貨;同樣開局賣爆的RabbitR1則相對好些,但也在大批交付時受到了類似「Android套殼」的不利評價。現在,又有一家公司進入了AI穿戴裝置賽道。科技媒體TheVerge昨天發布博文,表示AI新創公司Plaud推出了一款名為NotePin產品。有別於仍在「畫餅」階段的AIFriend,NotePin目前已開始

PHP框架的學習曲線取決於語言熟練度、框架複雜性、文件品質和社群支援。與Python框架相比,PHP框架的學習曲線較高,而與Ruby框架相比,則較低。與Java框架相比,PHP框架的學習曲線中等,但入門時間較短。
