OpenAI、Google雙標玩得溜:訓練大模型用他人數據,卻絕不允許自身數據外流
在生成式 AI 盛行的全新時代,大型科技公司在使用線上內容時正在奉行「照我說的做,而不是做我所做的策略。在某種程度上,這種策略可以說是一種雙標以及話語權的濫用。
同時,隨著大語言模型(LLM)成為 AI 發展的主流趨勢,無論是大型或新創公司,都在不遺餘力地開發自己的大模型。其中訓練資料是大模型能力好壞的重要前提。
近日,根據Insider 的報道,微軟支援的OpenAI、Google及其支援的Anthropic 多年來一直在使用其他網站或公司的線上內容來訓練他們的生成式AI 模型。這些都是在沒有徵求具體許可的情況下完成的,並將構成一場醞釀中的法律鬥爭的一部分,決定了網路的未來以及版權法在這一新時代的應用方式。
這些大型科技公司可能會主張他們是合理使用,是否真的如此有待商榷。但他們不會讓自己的內容被用來訓練其他 AI 模型。所以不禁要問,為什麼這些大型科技公司卻能在訓練大模型時使用其他公司的線上內容?
這些公司很聰明,但也非常虛偽
大型科技公司使用他人在線內容卻不允許他人使用自己的,這種說法是否有確切證據,這可以從他們一些產品的服務和使用條款中看出端倪。
首先來看 Claude,它是 Anthropic 推出的類似 ChatGPT 的 AI 助理。系統可以完成摘要總結、搜尋、協助創作、問答、編碼等任務。前段時間再次升級,將上下文 token 擴展到了 100k,處理速度大大加快。
Claude 的服務條款是這樣的。你不得以下列方式(這裡列舉出部分)存取或使用本服務,如果這些限制的任何一項與可接受使用政策不一致或不明確,則以後者依從為先:
- #開發與我們的服務競爭的任何產品或服務,包括開發或訓練任何AI 或機器學習演算法或模型
- 未經條款允許,從我們的服務中抓取、爬取或以任何其他方式取得資料或資訊
#Claude 服務條款網址:https://vault.pactsafe.io/s /9f502c93-cb5c-4571-b205-1e479da61794/legal.html#terms
#同樣地,Google的生成式AI 使用條款也是如此,「你不得使用本服務來開發機器學習模型或相關技術。」
#Google 產生式AI 使用條款位址:https: //policies.google.com/terms/generative-ai
OpenAI 的使用條款又怎樣呢?與Google類似,「你不得使用本服務的輸出來發展與OpenAI 競爭的模型。」
# #OpenAI 使用條款網址:https://openai.com/policies/terms-of-use
這些公司很聰明,他們知道高品質的內容對於訓練新的 AI 模型至關重要,所以不允許別人用這樣的方式使用他們的輸出也是合理的。但他們卻無所顧忌地利用他人資料來訓練自己的模型,這又該如何解釋呢?
目前,OpenAI、Google和 Anthropic 拒絕了 Insider 的置評請求,並且沒有做出任何回應。
Reddit、推特和其他公司:受夠了
實際上,其他公司意識到正在發生的事情時並不高興。今年 4 月,多年來一直被用於 AI 模型訓練的 Reddit 計劃開始對其資料的存取收費。
Reddit 執行長Steve Huffman 表示,「Reddit 的資料語料庫非常有價值,因此我們不能把這些價值免費提供給世界上最大的公司。」
同樣今年4 月,馬斯克指控OpenAI 的主要支持者微軟非法使用Twitter 的資料來訓練AI 模型。 「訴訟時間到」,他在推特上寫道。
不過在回覆Insider 的評論時,微軟表示「這個前提有太多的錯誤,我甚至不知道從何說起。 」
OpenAI 執行長Sam Altman 試圖透過探索尊重版權的全新AI 模型來深化這個問題。根據Axios 報道,他近期表示,「我們正在嘗試開發新的模式,如果AI 系統使用了你的內容,或者使用了你的風格,你就會因此獲得報酬。」
##Sam Altman
出版商(包括Insider)都會是既得利益者。此外,包括美國新聞集團在內的一些出版商已經在推動科技公司付費使用其內容訓練 AI 模式。
目前 AI 模型的訓練方式「打破」了網路有前微軟高階主管表示這一定有問題。微軟老將、著名軟體開發者 Steven Sinofsky 認為,目前 AI 模型的訓練方式「打破」了網路。
Steven Sinofsky
他正在推特上寫道,「過去,爬取資料是用來換取點擊率的。但現在只是用來訓練一個模型,沒有為創作者、版權所有者帶來任何價值。」
也許,隨著更多公司的覺醒,生成式AI 時代這個不均衡的資料使用方式會很快被改變。
以上是OpenAI、Google雙標玩得溜:訓練大模型用他人數據,卻絕不允許自身數據外流的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

WorldCoin(WLD)凭借其独特的生物识别验证和隐私保护机制,在加密货币市场中脱颖而出,吸引了众多投资者的目光。WLD凭借其创新技术,特别是结合OpenAI人工智能技术,在众多山寨币中表现突出。但未来几年,数字资产的走势如何呢?让我们一起预测WLD的未来价格。2025年WLD价格预测预计2025年WLD将实现显著增长。市场分析显示,WLD平均价格可能达到1.31美元,最高可能触及1.36美元。然而,在熊市情况下,价格可能跌至0.55美元左右。这一增长预期主要源于WorldCoin2.

繪製比特幣結構分析圖的步驟包括:1. 確定繪圖目的與受眾,2. 選擇合適的工具,3. 設計框架並填充核心組件,4. 參考現有模板。完整的步驟確保圖表準確且易於理解。

虛擬貨幣“最老”排行榜如下:1. 比特幣(BTC),發行於2009年1月3日,是首個去中心化數字貨幣。 2. 萊特幣(LTC),發行於2011年10月7日,被稱為“比特幣的輕量版”。 3. 瑞波幣(XRP),發行於2011年,專為跨境支付設計。 4. 狗狗幣(DOGE),發行於2013年12月6日,基於萊特幣代碼的“迷因幣”。 5. 以太坊(ETH),發行於2015年7月30日,首個支持智能合約的平台。 6. 泰達幣(USDT),發行於2014年,是首個與美元1:1錨定的穩定幣。 7. 艾達幣(ADA),發

支持跨鏈交易的交易所有:1. Binance,2. Uniswap,3. SushiSwap,4. Curve Finance,5. Thorchain,6. 1inch Exchange,7. DLN Trade,這些平台通過各種技術支持多鏈資產交易。

Aavenomics是修改AAVE協議令牌並引入令牌回購的提議,已為AAVEDAO實現了一個法定人數。 AAVE連鎖計劃(ACI)創始人馬克·澤勒(MarcZeller)在X上宣布了這一點,並指出它標誌著該協議的新時代。 AAVE連鎖倡議(ACI)創始人MarcZeller在X上宣布,Aavenomics提案包括修改AAVE協議令牌和引入令牌回購,已為AAVEDAO實現了法定人數。根據Zeller的說法,這標誌著該協議的新時代。 AaveDao成員以壓倒性的投票支持該提議,即在周三以每週100

適合新手的加密貨幣數據平台有CoinMarketCap和非小號。 1. CoinMarketCap提供全球加密貨幣實時價格、市值、交易量排名,適合新手與基礎分析需求。 2. 非小號提供中文友好界面,適合中文用戶快速篩選低風險潛力項目。

在波動劇烈的加密貨幣市場中,投資者正尋求超越熱門幣種的替代方案。 Solana(SOL)、Cardano(ADA)、XRP和Dogecoin(DOGE)等知名加密貨幣,儘管佔據著一定的市場地位,但也面臨著市場情緒、監管不確定性和可擴展性等挑戰。然而,一個新興項目RexasFinance(RXS)正在嶄露頭角。它並非依靠名人效應或炒作,而是專注於將現實世界資產(RWA)與區塊鏈技術結合,為投資者提供一種創新的投資方式。這一策略使其有望成為2025年最成功的項目之一。 RexasFi

2025年在槓桿交易、安全性和用戶體驗方面表現突出的平台有:1. OKX,適合高頻交易者,提供最高100倍槓桿;2. Binance,適用於全球多幣種交易者,提供125倍高槓桿;3. Gate.io,適合衍生品專業玩家,提供100倍槓桿;4. Bitget,適用於新手及社交化交易者,提供最高100倍槓桿;5. Kraken,適合穩健型投資者,提供5倍槓桿;6. Bybit,適用於山寨幣探索者,提供20倍槓桿;7. KuCoin,適合低成本交易者,提供10倍槓桿;8. Bitfinex,適合資深玩
