0程式碼微調一個大模型,成本不到20美元(人民幣約144元)?
流程也非常簡單,只要5步驟。
如LLaMA、GPT、StableLM等爆紅的開源生成模型,都能搞定。
圖片
這就是Monster API,一個最新火起來的API平台。
有人覺得這個開源領域的新工作,能改寫AI開發的遊戲規則,加速AI應用的速度。
圖片
還有人興奮提問,之後會接入GPT-3/GPT-4嗎?
圖片
所以,它具體是怎麼實現的?
簡單理解,Monster API就是將微調步驟盡可能簡易化,讓開發者不用再手動進行一系列設置,同時也提供便宜的GPU資源及內存優化。
具體過程如下:
第一步,選擇一個模型進行微調。
例如LLaMA-7B、GPT-J-6B、StableLM-7B等,Monster API提供了至少10個基礎大模型。
圖片
第二步驟,選擇或建立微調任務。例如指令微調、文字分類等,或自訂任務。
圖片
第三個步驟,選擇一個HuggingFace資料集。
Monster API可以無縫整合HuggingFace資料集,可選擇範圍很大;也可以根據任務類型推薦資料集。
且不用自己手動操作,就能自動設定好格式。
圖片
步驟,設定超參數。
圖片
步驟,檢查與提交。
在設定好如上所有步驟後,確定沒有錯誤就可以提交了。
Monster API表示可以透過WandB上的日誌來監控任務。
在其部落格中寫道,用DataBricks Dolly 15k微調LLaMA-7B完成3個epouch,成本僅需不到20美元(折合人民幣約144元)。
官網顯示,註冊用戶後會贈送2500點。會員分為三檔,收費分別為每月9美元/29美元/39美元。
圖片
Monster API不僅提供微調功能,還提供各種生成式AI的API接口,而且成本比其他方案低80%。
圖片
訊息顯示,Monster API背後公司拿下了110萬美元的種子前資金(pre-seed funding)。
這家AI新創公司給自己的定位是要做“GPU領域的愛彼迎”,把全世界分散的GPU資源實現靈活調度,讓開發者們能夠以更低的價格使用。
圖片
創始人是兩兄弟Gaurav Vij和Saurabh Vij。
其中Gaurav Vij也創立了一家CV公司,正是因為CV公司需要面臨龐大的雲端運算資本,才啟發了他們要做這樣一個平台。
Saurabh Vij之前是歐洲核子研究中心的粒子物理學家,同時也研究分散式計算。
兄弟倆表示在經過多輪技術迭代後,他們優化了消費級GPU在機器學習任務上的性能,使得運行Whisper AI模型的成本相較於AWS平台降低了90%,所以他們就想著為什麼不利用這個方法來幫助數以萬計的開發者。
同時他們透露公司的一個客戶使用他們的分散的GPU運算資源,已經節省了30萬美元。
參考連結:
[1]https://blog.monsterapi.ai/no-code-fine-tuning-llm/
[2] https://www.enterpriseai.news/2023/06/09/monster-api-launches-the-airbnb-of-gpus-with-1-1m-pre-seed/
以上是0碼微調大模型火了,只要5步,成本低至150塊的詳細內容。更多資訊請關注PHP中文網其他相關文章!