融合GPT大模型產品,WakeData新一輪產品升級
近期,WakeData惟客資料(以下簡稱 「 WakeData 」 )完成了新一輪的產品能力升級。
在2022年11月的產品發表會上,已傳遞出WakeData的「三個堅定」:始終堅定技術投入,全面夯實核心產品的科技能力和自研率;始終堅定國產化適配能力,支援國產晶片、作業系統、資料庫、中介軟體、國密演算法等,並在同領域實現對國外廠商的國產化替代;始終堅定擁抱生態,與夥伴共創共贏。
WakeData繼續新一輪的產品能力升級,憑藉過去5年的技術積累,以及在地產、零售、汽車等行業和垂直領域的實踐,與戰略夥伴聯合研發具有私有化部署能力的產業大模式WakeMind,將在AIGC 時代幫助更多企業自我革命、提升效能,持續解放生產力。
WakeMind模型的三大平台層
模型層:母艦平台將以具有私有化部署和業界客製化能力的WakeMind作為核心引擎,已接入了ChatGPT等大模型,同時支援接入如文心一言、通義千問等多個大模型能力
平台層:WakeMind基於Prompt提示工程、Plugin、LangChain等方式,實現與存取大模型的高效對話能力。在零樣本學習的基礎上,透過Prompt和Plugin管理,讓模型能夠更好的理解上下文資訊;透過投餵行業語料,讓模型快速學習行業知識,並具有行業和垂直領域的思考推理能力。
應用層:WakeMind母艦平台提供底層能力,透過一架又一架的艦載機去賦能產品應用和產業場景,提升企業內部生產力。
舉個例子,母艦平台如何賦能惟數雲。企業在藉助惟數雲端平台建置和使用資料資產的過程中,往往需要投入大量專業的資料開發工程師,參與到業務需求分析和資料開發工作中,而大量繁瑣的開發任務會導致整個資料價值實現週期被拉長。基於WakeMind賦能,只需要透過文字交互,惟數雲就可以自動產生對應的資料查詢語句,並一鍵執行查詢,能夠大幅提高資料查詢、分析、開發的效率,全面降低資料使用的技術門檻,以實現數據人人可用的目標。
WakeMind模型的三大特徵
#1)參數量更適合產業化和垂直領域場景。 AI產生的內容要達到人類水平,往往需要以「預訓練微調」的大模型為基礎;WakeData聯合業界領先的千億參數多模態預訓練大模型廠商,透過知識蒸餾和動態量化,壓縮出100億參數量的WakeMind模型;在聚焦的產業和垂直領域,基於P-Tuning V2可以將需要微調的參數減少到原來的千分之一,大幅降低微調所需的計算量。
2)具備行業化和垂直領域能力的文本創造和程式碼生成。
3)支援私有化部署和產業化客製化。產業或垂直領域的頭部企業,更希望具備私有化部署和產業化客製化大模型的能力。而如何在小樣本學習和低算力消耗的情況下進行有效的預訓練,已成為行業化定制模型的技術門檻。 WakeData產業資料和垂直領域資料的積累,將使產業大模型具有產業Know-How,並形成獨特的競爭優勢。
同時,WakeMind採用Transformer架構,以self-instruct方式產生數萬的指令遵循樣本數據,使用SFT(Supervised Fine-Tuning)、RLHF等技術實現意圖對齊,透過INT8量化後,可大幅降低推理成本,使模型具有私有化部署的可行性
大模型與行業化預訓練大模型
自OpneAI發布ChatGPT以來,給世界帶來了巨大衝擊。背後的大型語言模型 (Large Language Model,LLM) ,以及RLHF (Reinforcement Learning from Human Feedback) 即以強化學習方式依據人類反饋優化的語言模型,得到了廣泛關注。
WakeData創業初期,在NLP、CV、語音等領域就發表了11個AI模型,其中以NLP語意分析大模型的應用場景最為豐富。例如在低頻高客單價的地產置業、汽車、品牌零售等產業領域,SCRM是最有效的潛在客戶和存量客戶經營方式之一。 WakeData透過行業語料的累積和特定的預訓練,使AI對行業產生深刻理解,能夠在對話過程中24小時快速響應客戶問題,並且能夠基於會話信息,自動抽取客戶標籤,提升客戶畫像的分辨率。
在WakeData,AI大模型能力已經涵蓋到從底層客戶資料資產構建,中層客戶經營旅程和經營規則,再到上層的多接觸點行銷連結;具備能夠為整個數位化顧客經營的垂直領域'降本、提效、賦能'的能力。例如在CDP客戶資料平台領域,以前營運人員需要繁瑣的規則設計才能圈選到合適的目標客群,現在則透過簡單的語言描述和對話,AI即可以輔助找到對應的目標客群,大幅降低平台的使用學習成本,跨越式的提升使用效率與互動體驗。
在MA行銷自動化領域,WakeData的產品已經存取了微信生態、抖音、小紅書等觸點,並且支援自動化建立行銷旅程,提供豐富的旅程模版庫,可實現「即時的、一對一的、個人化的」用戶觸達。這其中有一個重要的環節是個人化行銷素材的生成,包括文字、圖片、圖文混排等,AI大模型可以大幅提升這個部分的效率和質量,同時降低成本。
在Loyalty大會員領域,當大會員系統橫跨不同行業、不同業態的時候,會員規則和會員資產拉通就會存在挑戰,WakeData的AI大模型基於大量行業經驗和語料訓練形成的Prompt引擎,透過簡單會話,描述不同業態會員的特性和業務訴求,就可以自動產生不同會員規則的映射邏輯和組合方案。
大模型在產業和垂直領域的實踐已證明其價值。
WakeMind商業路徑的三個階段
1)2018-2021年,自有模型應用和商業化探索期。基於WakeData的惟數雲、惟客雲、崑崙平台三條基礎產品線,將自研的NLP大模型在地產、新零售、汽車等產業,以及數位行銷等垂直領域進行全面的探索與實踐。
2)2022-2023年,WakeMind發布和母艦平台建設期。 WakeData聯合策略夥伴加速產業大模式WakeMind的研發,並透過母艦平台,使WakeMind具備產業化與垂直領域的客製化能力,具備私有化部署能力,具備通用大模式的存取與管理能力,實現對自有模型不能涵蓋場景的有利補充。
3)2023年及以後,全面進入WakeMind模型應用期。 WakeMind基於母艦平台的能力,全面接入惟客雲、惟數雲、崑崙平台等產品線,透過產業知識累積、產業場景優化、產業提示工程訓練,進一步提升模型的產業化能力,並將在地產、新零售、汽車等產業發起更大規模的商用。同時,WakeData本身也基於WakeMind母艦平台的能力,開始實現自我生產力的革命。
WakeData如何用AI解放生產力
WakeData公司的使命定義為「喚醒資料」,並已在大數據平台領域佈局多年。身為一家TOB企服公司,就「如何運用大模型」WakeData看到了巨大的機遇,並將大模型的運用覆蓋到了兩個方面:一方面是將大模型連接到產品,另一方面則幫助企業內部的設計師、程式設計師等人群使用大模型進行產品開發和客戶專案交付。
大模型的存取運用有兩個基本要素,有更適用的場景和具備大數據AI能力,WakeData主要的兩款產品「惟客雲」與「惟數雲」則為大模型的接入提供了便利。惟客雲能夠更方便的基於行業數位化應用將大模型工具無縫接入,客戶無需關心應用背後的複雜配置和技術優化;惟數雲則能夠基於行業幫助場景應用優化提示工程和垂直模型。而這也是WakeData一直堅持平台 應用的產品方案優勢。
同時,WakeData將大模型接入產品分為了兩類,一類是基於產品和行業業務流接入,這類接入的重點在於優化體驗和行業知識,幫助客戶快速、便利且有效的運用;第二類是基於產品結和開源大模型深度優化垂直場景,這類產品更符合大客戶對抗風險和資料安全上的訴求,同時基於行業的理解對模型可以不斷優化,可以維持這類客戶在垂直產業的持續競爭力。
「企業在數位轉型和數位化客戶經營當中要融合好大模型,大數據和場景是兩個關鍵要素。」WakeData創辦人兼CEO李柯辰表示。
在通常情況下,大模型都需要大量的資料進行有效訓練,因此具備產業化的資料平台能力變得至關重要。近日國家網路資訊辦公室發布了《生成式人工智慧服務管理辦法(徵求意見稿)》,其中特別強調了訓練和預訓練資料來源的合法合規,以及資料的真實性、準確性、客觀性、多樣化性。大模型的價值應用場景,更是大模型發展和商業化的重要因素;所謂場景就是指我們訓練的模型的用途,是否能在合法合規的前提下,為業務創造核心價值。
李柯辰認為,場景是運用大模型的環境,大數據和AI技術基礎是能力;擁有產業場景和產業數據的企業在獲得大模型能力時會更快、更有效、更敏捷。
WakeData的兩條核心產品線,正是對這兩大要素的累積;惟數雲作為新一代資料平台,具有強大的大數據Eed-to-End的資料處理能力,惟客雲作為新一代數位化客戶經營平台,其中包含了CDP、MA、SCRM、Loyalty等套件,擁有海量的業務應用場景,並且透過垂直行業深耕戰略,擁有更強的行業Know-How,擁有更多有價值的訓練樣本資料。在2022年惟數雲就發表5.0版本,其資料整合、資料運算、資料分析與治理、資料視覺化、資料資產化的能力均具有業界領先的優勢。而這些數據側的優勢,也成為大模型時代產業化人工智慧應用的競爭壁壘。
「在WakeData內部已經初步形成推進生產力解放的工作氛圍,WakeMind能力在產品設計、開發測試、行銷營運等領域,都已經展開使用,初步運用已實現人效達到20%的提升。在加快產品研發的同時,也提升了客戶專案交付的效率,也為客戶的數位化專案落地節省了時間成本。。」WakeDataCTO錢勇說到。
崑崙平台由基礎雲、開發雲、整合雲端三部分組成,是WakeData產品研發和實施交付過程中非常重要的雲端原生技術底座。崑崙平台開發雲端透過WakeMind賦能,工程師已經在探索「基於產品文檔,輔助生成對應的架構設計、資料模型設計,再輔助生成程式碼、偵測程式碼的正確性」等方面的應用。例如在推進領域驅動設計的過程中,WakeMind可以輔助學習DDD、輔助工程師進行領域建模;在資料建模的過程中,可以透過自然語言互動進行資料模型的建立、修改、自動補充完善,快速生產SQL語句;在產品研發過程中,透過輸入產品文檔,提取和產生產品術語表,並進行詳細的解釋說明等。
對普通的工程師來說,在產生規則類別程式碼、自動產生單元測試、程式碼審查和最佳化等領域,已經可以大幅提高開發效率了。
WakeMind提供全員可用的文案產生助手。
市場部門透過AI的 Text to Video快速建構的行銷成長矩陣。
AIGC賦能產業和垂直領域是必然趨勢,也是WakeData自創業以來的核心發展路徑。對於類ChatGPT的技術和服務,WakeData一直保持開放和擁抱的態度,並且積極投身其中,在聚焦行業化經營的戰略基礎上,緊緊把握其價值化和商業化的路徑。惟客資料的 WakeMind 產業大模型,將在 AIGC 時代幫助更多企業自我革命、提升效能,持續解放生產力。
以上是融合GPT大模型產品,WakeData新一輪產品升級的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

火山引擎總裁譚待企業要做好大模型落地,面臨模型效果、推理成本、落地難度的三大關鍵挑戰:既要有好的基礎大模型做支撐,解決複雜難題,也要有低成本的推理服務讓大模型廣泛應用,還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地,位元組跳動自主研發的豆包大模型將透過火山

“高度复杂、碎片化程度高、跨领域”一直是交通行业数智化升级路上的首要痛点。近日,由中科视语、西安市雁塔区政府、西安未来人工智能计算中心联合打造的参数规模千亿级的“秦岭·秦川交通大模型”,面向智慧交通领域,为西安及其周边地区打造智慧交通创新支点。“秦岭·秦川交通大模型”结合西安当地海量开放场景下的交通生态数据、中科视语自研的原创先进算法以及西安未来人工智能计算中心昇腾AI的强大算力,为路网监测、应急指挥、养护管理、公众出行等智慧交通全场景带来数智化变革。交通管理在不同城市有不同的特点,不同道路的交

一、TensorRT-LLM的產品定位TensorRT-LLM是NVIDIA為大型語言模型(LLM)所開發的可擴展推理方案。它基於TensorRT深度學習編譯框架建構、編譯和執行計算圖,並藉鑒了FastTransformer中高效的Kernels實作。此外,它還利用NCCL實現設備間的通訊。開發者可以根據技術發展和需求差異,客製化算子以滿足特定需求,例如基於cutlass開發客製化的GEMM。 TensorRT-LLM是NVIDIA官方推理方案,致力於提供高效能並不斷完善其實用性。 TensorRT-LL

4月4日消息,日前,國家網信辦公佈已備案大模型清單,中國移動「九天自然語言交互大模型」名列其中,標誌著中國移動九天AI大模型可正式對外提供生成式人工智慧服務。中國移動表示,這是同時透過國家「生成式人工智慧服務備案」和「境內深度合成服務演算法備案」雙備案的首個央企研發的大模型。據介紹,九天自然語言交互大模型具有產業能力增強、安全可信、支援全端國產化等特點,已形成90億、139億、570億、千億等多種參數量版本,可靈活部署於雲、邊、端不同場

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年,正是大模型盛行的時期,很多企業認為已經大模型之後圖譜的重要性大大降低了,之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行,我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提,因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展,其中有許多技巧和方法可以挖掘。可見一個新技術的出現,並不是將所有的舊技術打敗,也有可能將新技術和舊技術相互融合後

如果試題太簡單,學霸和學渣都能考90分,拉不開差距……隨著Claude3、Llama3甚至之後GPT-5等更強模型發布,業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織LMSYS推出下一代基準測試Arena-Hard,引起廣泛關注。 Llama3的兩個指令微調版本實力到底如何,也有了最新參考。與先前大家分數都相近的MTBench相比,Arena-Hard區分度從22.6%提升到87.4%,孰強孰弱一目了然。 Arena-Hard利用競技場即時人類數據構建,與人類偏好一致率也高達89.1%

注意看,這個男人把超1000種大模型接入,讓你可插拔無縫切換使用。最近也上線了可視化的AI工作流程:給你一個直覺的拖放介面,拖拖、拉拉、拽拽,就能在無限畫布上編排自己個兒的Workflow。正所謂兵貴神速,量子位聽說,這個AIWorkflow上線不到48小時,就已經有用戶配出了100多個節點的個人工作流程。不賣關子,今天要聊的是LLMOps公司Dify,及其CEO張路宇。張路宇也是Dify的創辦人。投入創業前,有11年的網路經驗。搞產品設計,懂專案管理,也對SaaS有點自己的獨到見解。後來他
