大神李沐、快手元老李岩被曝離職後轉投大模型,ChatGPT掀起AI創業狂飆
最近,網路大佬紛紛投身大模型賽道。
昨天,李沐大神離職亞馬遜、去做大模型的消息,如同驚雷一般炸響了大家的社交網絡。
緊接著,今天又曝出前快手AI核心大佬李岩在2022年離職快手後成立的新公司,做的也是大模型。
顯然,自從ChatGPT讓全世界看到了AI上天入地般的應用場景,國內企業的AI模型層競爭,已經開始白熱化了。
快手大佬李岩創業,進軍多模態
#李岩在2022年下半年成立了AI公司「元石科技」,主要進行多模態大模型的研發。
李岩是工號在75上下的快手老員工,也是快手AI技術研發的核心人物。
2015年11月,在時任快手CEO的宿華的支持下,李岩組建了內部第一個深度學習部門DL(Deep Learning)組,目標是構建演算法模型對違法違規的影片內容進行辨識。
隨後,快手對影片內容理解產生了更多的需求。 2016年,李岩將團隊的名字從DL組改為MMU(Multimedia understanding,多媒體內容理解)組,在解決安全合規問題之外,涉獵語音、文字、圖像等多種形式的演算法模型研發。
在2018年的CNCC大會上,李岩便以題為「多模態內容生產與理解」的演講,強調了多模態模型技術的重要性:
- 改變人機互動的方式
- 讓訊息分發更有效率
以我們常刷的短影片為例,除了視覺、聽覺和文字這些多模態訊息外,使用者的行為也是另一種模態的數據。
如此一來,影片的本身再加上使用者的行為,就共同構成了一個非常複雜的多模態問題。
而多模態研究的目的便是,讓人機互動的方式變得越來越自然和舒適。
然而,多模態的研究難度頗高。
一方面要面對單模態的語意鴻溝問題,以及如何針對不同模態的資料進行綜合建模的異質鴻溝問題;另一方面,還要解決由於多模態資料集建構困難而造成的資料缺失問題。
當時,學術界有不少研究還是停留在單模態領域,而李岩則堅定地認為,未來多模態會成為更有價值的研究方向。
在快手的經歷,讓李岩對於AI在短片上的生態有了第一線的深刻理解,2021年,他選擇從快手離職。
2022年下半年,他成立了元石科技,根據36氪的獨家求證,元石科技主攻的就是多模態大模型的研發。
師徒一體:寫書、創業、再創業
而昨天,李沐大神疑似加入大模型創業的消息,也瞬間在社群網路上刷螢幕。
根據公號「親愛的資料」訊息,「參數伺服器之父」Alex Smola在今年2月離職亞馬遜,並創辦了一家名為Boson.ai人工智慧公司。
至於這家新公司的介紹資料不多,目前官方頁面還在建設中。
#連結:https://boson.ai/
可以肯定的是,要做大模型相關的項目。
另根據Alex的領英主頁介紹,「我們正在做一件大事。如果你對可擴展基礎模型感興趣,請聯繫我。」
值得注意的是,在這家公司GitHub主頁上,亞馬遜首席科學家李沐也貢獻了程式碼。
因此,外界猜測李沐現已加入了Boson.ai,跟隨導師一起去創業了。
不過,到目前為止,其主頁還未更新。
李沐和Alex Smola曾在2016年創辦了一家名為Marianas Labs資料分析演算法公司。
當時,李沐任CTO兼共同創辦人。
李沐曾在《博士這五年》一文中提到,
當時深度學習的火熱導致各種巨資收購新創部門不斷。
Alex便和他拿了幾十萬的天使投資風風火火乾了好一陣子,Alex寫爬蟲,他自己跑模型,後來賣給一個小上市公司公司1-Page。
#要說師徒二人的相識最早是在卡內基美隆大學(CMU )。
2012年9月,李沐前往CMU深造,師從的便是Alex Smola。
當時,Alex還在Google任職,沒有經費,就把他丟給了Dave Andersen。因此,李沐便有了兩個導師,一個做機器學習,一個做分散式系統。
在CMU的前半年,李沐每週都會與兩位導師一起聊一個小時。
由於兩位導師風格迥異,而Alex反應特別快,想要跟上他的節奏很難。若想闡述自己的想法,需要做更多的功課。
而Dave會幫助李沐把一個東西理解透,不會給出很多想法。
在兩位導師的輔導下,李沐迅速成長。
在CMU求學的第二年,正當餘凱等人在做深度學習,李沐便也加入這波研究熱潮。
基於對分散式深度學習框架的興趣,他選擇與陳天奇合作,將CXXNet作為起點,做深度學習相關專案。
當兩人一起寫xgboost 分散式啟動腳本時,便發現檔案讀取可以是多個專案共同使用。
為了避免重複造輪子,李沐和陳天奇在合力在Github上創建了一個叫DMLC的組織,隨後更是創建了隨後大獲成功的MXNet。
#2016年7月,Alex加入了亞馬遜。同時,李沐便帶著MXNet先以兼職身分加入亞馬遜,畢業後選擇留下來。
2019年期間,師徒兩人也曾在UC柏克萊一起講課。
2021年,兩人在史丹佛大學也一起教授「Practical Machine Learning」。
#值得一提的是,《動手學習深度學習》這本書便是由李沐,美國伊利諾大學香檳分校電腦科學博士Aston Zhang,還有導師Alex一起寫。
這本書推出後便大受歡迎。身為MXNet的作者之一,李沐的這本《動手學深度學習》也是使用 MXNet 框架寫成的
大模型路上,還有誰?
多模態的方向,是李岩很早就想做的。而李沐追隨導師去創業,或許多少都受到了ChatGPT爆火的影響。
而國內企業的AI模型層競爭,已經開始白熱化了。現在的大模型賽道中,擠滿了巨頭派、大佬派、海歸/大廠高層派、小新創公司轉型派、教授派、醬油派等各路選手。
2月13日,已經從美團退休2年的王慧文帶著一紙「AI英雄榜」重回大眾視野,稱自己將拿出5000萬美元「有資入組」,且「不關心職位、薪資和title,求組隊」。
前有王慧文把大模型創業的門票拉高到5000萬美金之後,後有「出門問問」創辦人李志文官宣下場大模型競賽。
李志文曾在2020年領導團隊,訓練出大模型UCLAL
另外,還有前搜狗CEO王小川也發文隱晦地宣布,自己即將進入「中國的OpenAI」的戰場,並向36氪承認自己在快速籌備中。
2月26日,銜遠科技的創辦人、首席科學家週伯文也發布一則消息指出招募合夥人,一起打造中國版ChatGPT。
最近各種需求的激增,已經顯示了國內產生人工智慧產品的潛在市場大得驚人。
ChatGPT的爆火,意味著奇點已至,它引發了更底層、更深層的變化,新一代AI將融合物理世界和資訊世界,實現知識、計算、推理的閉環。
短短兩天內,就有兩位大佬被曝下場創業,開闢大模型賽道。而國內巨頭們預告的記者會,都將在幾個月內召開。
所以,這場自開年就打響的AI大模型國內追逐賽,或許馬上就能看到有選手衝刺終點了。
以上是大神李沐、快手元老李岩被曝離職後轉投大模型,ChatGPT掀起AI創業狂飆的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。
