AI不適合開源? MongoDB副總裁:開源程式碼對人工智慧不適用
是時候聊聊AI開源的問題了。
顯然,這是搞開發的人必須面對的問題。基本上從2006年開始,開不開源就已經成為頭等問題之一了。
Matt Asay在MongoDB負責行銷這塊。在此之前,他曾是亞馬遜網路服務的負責人和Adobe的開發者生態系統負責人。
而在加入Adobe之前,Asay曾在開源公司擔任過一系列職務。 MongoDB的業務發展、行銷和社群副總裁、即時分析公司Nodeable(後來被Appcelerator收購)的業務發展副總裁、行動HTML5新創公司Strobe(後來被Facebook收購)的業務發展副總裁和臨時CEO,以及Ubuntu Linux公司Canonical的COO和內容管理新創公司Alfresco的美洲區負責人。
最終,Asay成為了開放原始碼倡議(OSI)的榮譽董事,並獲得了史丹佛大學的法學博士學位。在
之前,Matt Asay曾指責Google和雅虎兩家公司在開源程式碼上有所保留,然後他被罵了。
現在想來,是有道理的。
Tim O'Reilly表示,在開源的雲端時代,開發者分享程式碼的動機,是讓別人跑自己的程序,從而提供一份原始碼。而這件事的必要性已經慢慢消失了。
Reilly繼續指出,不但沒必要,而且就最大的App來看,這也不再可能了。
在過去的十年裡,這種分享的不可能推翻了原先開源的定義。如今,新的定義正在影響我們思考人工智慧的方式。
正像Mike Loukides指出的那樣,在AI方面的合作從未像現在這麼重要,也從未像現在這麼困難。
就像2006年的雲端運算一樣,在人工智慧領域做最有趣的工作的公司可能會努力以傳統的方式開源。
但即使他們開源的方式是傳統的,也不代表他們不能用更有意義的方式開放。
開放基礎設施
Loukides認為:「雖然現在很多公司都說自己在搞AI,但真正推動這個產業向前發展的只有三家公司-Meta、OpenAI和Google。」
他們仨有著一個共同點:都擁有可以大規模運行大型模型的能力。這種能力背後,需要強大的基礎設施和技術手段,而這往往是許多個人和企業所沒有的。
的確,你可以從Meta下載OPT-175B的原始碼,但你手邊的硬體卻無法對其進行訓練。甚至是對大學或其他的研究機構來說,OPT-175B都太龐大了。
另一方面,即使有足夠計算資源的Google和OpenAI,也無法輕易地複刻OPT-175B 。
原因也很簡單:OPT-175B與Meta自己的基礎設施(包括客製化硬體)聯繫過於緊密,很難被移植到其他地方。
#也就是說,Meta並沒有想要隱瞞有關OPT-175B的什麼,而是建造一個差不多基礎設施真的很難。即便是對於那些有資金和技術的人來說,最終搞出來的也會是個不大一樣的版本。
而這正是雅虎的Jeremy Zawodny和Google的Chris DiBona在2006年的OSCON上提出的觀點。
但話又說回來,如果你不了解機器內部的科學原理,就很難去相信一個AI。
所以,我們需要去尋找某種方法,讓基礎設施能開放使用。
Loukides認為,應該向外部研究人員和早期使用者提供免費存取權。不過,並不是說給他們一個可以存取Meta,Google或OpenAI的資料中心的萬能鑰匙,而是透過一個公共API。
這可能不是大多數人所期待的「開源」,但其實還是可以接受的。
換個方式看待開源
現在,Matt Asay曾經對Google和雅虎指責如今沒什麼意義了。
自2006年以來,Google在滿足戰略需求的前提下,打包並開源了關鍵基礎設施。
在Matt Asay看來,TensorFlow 是開源的入口,Kubernetes是開源的出口。這些開源的機器學習產業標準有望提升Google Cloud的工作負載,或確保Google雲端之間的可攜性,從而為Google Cloud贏得更多的工作負載。
想出這些的人很聰明,但在Pollyanna 的意義上,它並不是開源的。
不是只有Google這樣。它只是在開源上做得比其他公司好。開源本質上是自私的,公司和個人總是會開放有利於自己或客戶的程式碼。
一直都是如此,而且永遠如此。
Loukides認為應該有意義地開放AI(儘管三大AI巨頭與其他公司之間存在差異),但他指的開源並不是我們一般意義上理解的開源。為什麼呢?
原因在於,雖然傳統的開源很不錯,但無論是對於軟體的創建者和消費者,它都從未成功解決DiBona和Zawodny於2006年在OSCON上提出的雲端開源難題。
現在已經過了十幾年了,我們依然沒有離答案更近一步。
話又說回來,我們確實近了一點。
Matt Asay認為,我們需要以一種新的方式來看待開源。
他與Loukides的想法很接近:關鍵在於為研究人員提供足夠的存取權限,使他們能夠重現一個特定的AI模型是如何成功或失敗的。
「他們並不需要完全存取所有的程式碼和基礎設施來運行這些模型」。正如他所言,只有在開發人員可以在筆記型電腦上執行開源程式、進行衍生創作的前提下,完全存取該程式碼才是有意義的。
鑑於如今Google或微軟運行程式碼的規模和獨特的複雜性,這已經毫無意義了——我們不可能完全訪問大規模的雲端程式碼。
我們需要明白:開源並不是用來觀察開源世界的一個鏡頭。而且考慮到我們如今所處的雲端時代,開源也用得越來越少。
#無論是作為公司還是作為個人,我們的目標應該是以有利於客戶和第三方開發人員的方式開放對軟體的訪問,讓軟體更易理解,而不是試圖將幾十年前的開源概念改造成雲。它不適用於開源,就像它不適用於AI一樣。
是時候換個想法了。
以上是AI不適合開源? MongoDB副總裁:開源程式碼對人工智慧不適用的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

本文介紹如何在Debian系統上自定義Apache的日誌格式。以下步驟將指導您完成配置過程:第一步:訪問Apache配置文件Debian系統的Apache主配置文件通常位於/etc/apache2/apache2.conf或/etc/apache2/httpd.conf。使用以下命令以root權限打開配置文件:sudonano/etc/apache2/apache2.conf或sudonano/etc/apache2/httpd.conf第二步:定義自定義日誌格式找到或

Tomcat日誌是診斷內存洩漏問題的關鍵。通過分析Tomcat日誌,您可以深入了解內存使用情況和垃圾回收(GC)行為,從而有效定位和解決內存洩漏。以下是如何利用Tomcat日誌排查內存洩漏:1.GC日誌分析首先,啟用詳細的GC日誌記錄。在Tomcat啟動參數中添加以下JVM選項:-XX: PrintGCDetails-XX: PrintGCDateStamps-Xloggc:gc.log這些參數會生成詳細的GC日誌(gc.log),包含GC類型、回收對像大小和時間等信息。分析gc.log

在Debian系統中,readdir函數用於讀取目錄內容,但其返回的順序並非預先定義的。要對目錄中的文件進行排序,需要先讀取所有文件,再利用qsort函數進行排序。以下代碼演示瞭如何在Debian系統中使用readdir和qsort對目錄文件進行排序:#include#include#include#include//自定義比較函數,用於qsortintcompare(constvoid*a,constvoid*b){returnstrcmp(*(

本文介紹如何在Debian系統中使用iptables或ufw配置防火牆規則,並利用Syslog記錄防火牆活動。方法一:使用iptablesiptables是Debian系統中功能強大的命令行防火牆工具。查看現有規則:使用以下命令查看當前的iptables規則:sudoiptables-L-n-v允許特定IP訪問:例如,允許IP地址192.168.1.100訪問80端口:sudoiptables-AINPUT-ptcp--dport80-s192.16

Debian系統中,Nginx的訪問日誌和錯誤日誌默認存儲位置如下:訪問日誌(accesslog):/var/log/nginx/access.log錯誤日誌(errorlog):/var/log/nginx/error.log以上路徑是標準DebianNginx安裝的默認配置。如果您在安裝過程中修改過日誌文件存放位置,請檢查您的Nginx配置文件(通常位於/etc/nginx/nginx.conf或/etc/nginx/sites-available/目錄下)。在配置文件中

在Debian系統中,readdir系統調用用於讀取目錄內容。如果其性能表現不佳,可嘗試以下優化策略:精簡目錄文件數量:盡可能將大型目錄拆分成多個小型目錄,降低每次readdir調用處理的項目數量。啟用目錄內容緩存:構建緩存機制,定期或在目錄內容變更時更新緩存,減少對readdir的頻繁調用。內存緩存(如Memcached或Redis)或本地緩存(如文件或數據庫)均可考慮。採用高效數據結構:如果自行實現目錄遍歷,選擇更高效的數據結構(例如哈希表而非線性搜索)存儲和訪問目錄信

在Debian郵件服務器上安裝SSL證書的步驟如下:1.安裝OpenSSL工具包首先,確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝,可以使用以下命令進行安裝:sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來,使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求(CSR):openss

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法,包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables(如果尚未安裝):sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則:sudoiptables-L配置
