一夕之間,亞馬遜來了個「彎道超車」。
在全球各大科技巨頭都在擁抱如今最火的大模型、AIGC 的時候,亞馬遜給人的印像只有一個:隱身。
雖然 AWS 一直在為 Hugging Face、Stability AI 等大模型明星公司提供機器學習算力,不過亞馬遜很少透露合作的細節。有網友曾統計,在過去一段時間的財報財報會議上,亞馬遜提到 AI 的次數幾乎是零。
但如今,亞馬遜的態度已經發生了巨大的變化。
4 月13 日,亞馬遜執行長安迪・賈西(Andy Jassy)發布了2022 年度股東信,稱他對亞馬遜能夠控製成本並繼續投資於新的成長領域充滿信心。他在信中 biaoshi,亞馬遜未來將大力投資當下十分熱門的大型語言模型(LLM)和生成式人工智慧(AI)領域。
賈西表示,在過去的幾十年裡,亞馬遜在各種應用中使用機器學習。該公司現在正在開發自己的大語言模型,其有可能改善「幾乎所有客戶體驗」。
話音未落,亞馬遜的大模型及服務就被揭開了面紗。
「大多數公司都想用大型語言模型,但真正好用的語言模型需要數十億美元和多年的時間來訓練,人們不想經歷這些,」安迪・賈西表示。 「因此,他們期待從一個已經非常龐大的基礎模型中進行提升,然後能夠根據自己的目的對其進行自訂。這就是Bedrock。」
亞馬遜版ChatGPT:是其雲端服務的一部分。
在最新的公告中,AWS 介紹了一組新模型 —— 統稱為「Amazon Titan」。
Titan 系列模型分為兩種,一種是用於內容生成的文本模型,另一種是可創建向量嵌入的嵌入模型,用於創建高效搜尋功能等。
文本生成模型類似於OpenAI 的GPT-4(但在性能方面不一定相同),可以執行諸如撰寫博客文章和電子郵件、總結文檔和從數據庫中提取信息等任務。嵌入模型將文字輸入(如單字和短語)翻譯成數字表示形式,稱為嵌入,其中包含文字的語義。
基於OpenAI 語言模型的ChatGPT 和微軟Bing 聊天機器人的人有時會產出不準確的訊息,這是由於一種稱為「幻覺」的行為,輸出看起來很有說服力,但實際上與訓練資料無關。
AWS 副總裁 Bratin Saha 在接受 CNBC 採訪時表示,亞馬遜「非常關心」準確性並確保其 Titan 車型產生高品質的回應。
客戶將能夠使用自己的資料自訂 Titan 模型。但另一位副總裁表示,這些數據永遠不會用於訓練 Titan 模型,以確保包括競爭對手在內的其他客戶最終不會從這些數據中受益。
Sivasubramanian 和Saha 拒絕談論Titan 模型的大小或確定亞馬遜用於訓練它們的數據,Saha 也不願描述亞馬遜為刪除模型訓練數據中有問題的部分而遵循的過程。
Titan 模型的發布,其實是亞馬遜「Bedrock」計畫的一部分。全球最大的雲端基礎設施供應商亞馬遜,顯然不會將這樣一個快速成長的領域留給谷歌和微軟這些對手。
Bedrock 計畫是在 OpenAI 發布 GPT-4 一個月後推出的。當時,微軟已向 OpenAI 投資數十億美元,並透過 Azure 雲端服務為 OpenAI 提供算力。這是亞馬遜 AWS 業務面臨的最強大的競爭。
Bedrock 雲端服務類似於由微軟支援的新創公司 OpenAI 提供支援的 ChatGPT 聊天機器人背後的引擎。透過其 Bedrock 生成式人工智慧服務,亞馬遜網路服務將提供 Titan 等模型的存取。
該服務支援的初始基礎模型集還包括來自 AI21、Anthropic 和 Stability AI 的模型,以及亞馬遜自研的 Titan 系列新模型。 Bedrock 的亮相,某種程度上預示著 AWS 在過去幾個月與生成式 AI 新創公司達成了合作關係。
Bedrock 的關鍵優勢在於,使用者可將其與 AWS 雲端平台的其餘部分整合在一起。這意味著組織將能夠更輕鬆地存取儲存在 Amazon S3 物件儲存服務中的數據,並能夠從 AWS 存取控制和治理策略中受益。
亞馬遜目前沒有透露 Bedrock 服務的成本,因為它還處於有限的預覽階段。一位發言人表示,客戶可以將自己加入候補名單。此前,微軟和 OpenAI 已經公佈了使用 GPT-4 的價格,起價為每 1000 個 token 幾美分,一個 token 相當於大約四個英文字符,而谷歌尚未公佈其 PaLM 語言模型的定價。
我們知道,程式設計將是生成式 AI 技術快速應用的領域之一。今天,軟體開發者需要花費大量時間編寫相當淺顯和無差別的程式碼,還得花不少時間學習複雜的新工具和技術,而這些工具和技術總是不斷演進。因此,開發者真正用於開發創新功能與服務的時間少之又少。
為應對這一難題,開發者會嘗試從網路上複製程式碼片段再進行修改,但可能無意中複製了無效程式碼和有安全隱患的程式碼。這種搜尋和複製的方式也浪費了開發者用於業務建置的時間。
生成式AI 可以透過「寫」大部分無差別的程式碼來大幅減少這種繁重的工作,讓開發人員更快地編寫程式碼,同時有更多時間專注在更具創意的程式設計工作上。
2022 年,亞馬遜宣布推出 Amazon CodeWhisperer 預覽版。這款 AI 程式設計助理透過內嵌的基礎模型,根據開發者用自然語言描述的註解和 IDE 中的既有程式碼即時產生程式碼建議,提升工作效率。預覽版發布後得到了開發者的熱烈回應,與未使用該程式設計助理的開發者相比,使用者完成任務的速度平均快 57%,成功率提高 27%。
現在,亞馬遜宣布 CodeWhisperer 正式可用,免費向所有個人用戶開放,不設任何資格或使用時長的限制。另外還提供引用追蹤和每個月 50 次的安全掃描服務。用戶只需郵箱註冊,無需亞馬遜雲端服務帳號。企業客戶可以選擇包含更多高階管理功能的專業版。
除了適用Python、Java、JavaScript、TypeScript 和C# 之外,CodeWhisperer 新增了對Go、Kotlin、Rust、PHP 和SQL 等10 種開發語言的支援。開發者可以透過在 VS Code、IntelliJ IDEA、Amazon Cloud9 等整合開發環境中的 Amazon Toolkit 外掛程式存取 CodeWhisperer,也可在 Amazon Lambda 控制台中使用。
亞馬遜表示,除了從數十億行公開程式碼中學習之外,CodeWhisperer 還基於亞馬遜的程式碼進行了訓練。因此它是目前為亞馬遜雲端服務(包括 Amazon EC2 等)產生程式碼的最準確、最快和最安全的方式。
AI 程式設計助理產生的程式碼可能包含隱藏的安全漏洞,因此 CodeWhisperer 提供了內建安全掃描功能(透過自動推理實現),這是唯一一個這樣做的。此功能可尋找難以偵測的漏洞並提出補救建議,如十大開放式 Web 應用程式安全專案(OWASP)中的漏洞以及不符合加密庫最佳實踐的漏洞等。
此外,為了幫助開發人員以負責任的方式開發程式碼,CodeWhisperer 會過濾掉可能被認為有偏見或不公平的程式碼建議。同時由於客戶可能需要對開源程式碼來源進行參考或取得其使用許可,CodeWhisperer 也是唯一可以對疑似開源程式碼建議進行過濾和標記的程式設計助理。
亞馬遜在 AI 領域佈局了 20 多年,而 AWS 已經擁有超過 10 萬家 AI 客戶。 Sivasubramanian 表示,亞馬遜一直在使用經過微調的 Titan 版本,透過其主頁提供搜尋結果。
然而,亞馬遜只是在 ChatGPT 出現並走紅後,推出生成式 AI 能力的大公司之一。 Expedia、HubSpot、Paylocity 和 Spotify 都致力於整合 OpenAI 技術,亞馬遜則不然。 「我們總在一切準備就緒時行動,所有技術早已出現。」Sivasubramanian 這樣說到。由於使用客製化的 AI 處理器,亞馬遜希望確保 Bedrock 易於使用且具有成本效益。
目前,C3.ai、Pegasystems 和 Salesforce 等公司都已準備好引進 Amazon Bedrock。
以上是亞馬遜高調入局ChatGPT大戰,發布Titan大模型、AI編程助手全免費,CEO:改變所有體驗的詳細內容。更多資訊請關注PHP中文網其他相關文章!