首頁 科技週邊 人工智慧 許多主要新聞媒體正在屏蔽 OpenAI 爬蟲

許多主要新聞媒體正在屏蔽 OpenAI 爬蟲

Feb 29, 2024 am 10:10 AM
openai 爬蟲

自OpenAI推出内容生成式人工智能模型以来,网络上的数据被广泛应用于训练和改进这些模型。然而,根据路透社研究所的调查显示,越来越多的新闻媒体开始对OpenAI的数据采集表示疑虑,甚至有超过50%的传统媒体对此持反对态度。这表明对数据隐私和使用的关注正在增加,并提醒人们在人工智能发展过程中需要更多的透明度和合规性。

路透社研究所分析了《纽约时报》、《华尔街日报》、《华盛顿邮报》、CNN、NPR 等多家主流新闻媒体,涵盖美国、英国、德国、印度等10个国家,并将其归为传统印刷媒体(纸媒)、广播电视媒体、数字媒体三大类。研究发现,57%的传统印刷媒体屏蔽了OpenAI 的爬虫程序,广播电视媒体和数字媒体的比例分别为48%和 31%。

研究还指出,不同国家和地区屏蔽 OpenAI 的新闻网站比例存在显著差异。在美国,这一比例高达79%,而在墨西哥和波兰则仅为20%。

许多主要新闻媒体正屏蔽 OpenAI 爬虫

所研究调查的10个国家新闻媒体对 OpenAI爬虫采取屏蔽措施的比例差异

此外, 在屏蔽了OpenAI 爬虫的新闻媒体中,有97%也同样屏蔽了谷歌人工智能的爬虫。

某些研究揭示了新闻媒体对人工智能使用其内容持谨慎态度。他们担心,如果人们通过人工智能获取新闻,可能导致媒体被边缘化或替代。Gartner副总裁兼杰出分析师安德鲁·弗兰克指出:“路透社的研究突显了生成式人工智能所面临的一个核心挑战:它的运作依赖于真实个体创造的真实内容,而这些个体可能视之为对其谋生方式的潜在威胁。”

近期,康奈尔大学的一项研究指出,当新的人工智能模型在训练过程中主要依赖于先前模型而非人类提供的数据时,往往会出现“模型崩溃”或退化的情况。这导致人工智能系统生成的信息中出现更多错误。这一现象突显了在人工智能领域中存在的潜在风险和挑战,需要更深入的研究和探讨。这项研究结果提醒我们,在开发人工智能技术时要谨慎对待数据来源和训练方法,以

去年8月初,OpenAI推出了人工智能爬虫,随后谷歌也在9月推出了类似产品。研究指出,如果这些媒体做出了屏蔽决定,可能会很难逆转这一立场并解除屏蔽。

以上是許多主要新聞媒體正在屏蔽 OpenAI 爬蟲的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

編程新範式,當Spring Boot遇上OpenAI 編程新範式,當Spring Boot遇上OpenAI Feb 01, 2024 pm 09:18 PM

2023年,AI技術已成為熱門話題,對各行業產生了巨大影響,程式設計領域尤其如此。人們越來越認識到AI技術的重要性,Spring社群也不例外。隨著GenAI(GeneralArtificialIntelligence)技術的不斷進步,簡化具備AI功能的應用程式的創建變得至關重要和迫切。在這個背景下,"SpringAI"應運而生,旨在簡化開發AI功能應用程式的過程,使其變得簡單直觀,避免不必要的複雜性。透過"SpringAI",開發者可以更輕鬆地建立具備AI功能的應用程序,將其變得更加易於使用和操作

選擇最適合資料的嵌入模型:OpenAI 和開源多語言嵌入的對比測試 選擇最適合資料的嵌入模型:OpenAI 和開源多語言嵌入的對比測試 Feb 26, 2024 pm 06:10 PM

OpenAI最近宣布推出他們的最新一代嵌入模型embeddingv3,他們聲稱這是效能最出色的嵌入模型,具備更高的多語言效能。這一批模型被劃分為兩種類型:規模較小的text-embeddings-3-small和更強大、體積較大的text-embeddings-3-large。這些模型的設計和訓練方式的資訊披露得很少,模型只能透過付費API存取。所以就出現了很多開源的嵌入模型但是這些開源的模型與OpenAI閉源模型相比如何呢?本文將對這些新模型與開源模型的效能進行實證比較。我們計劃建立一個數據

OpenAI超級對齊團隊遺作:兩個大模型博弈一番,輸出更好懂了 OpenAI超級對齊團隊遺作:兩個大模型博弈一番,輸出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統在更重要的領域中得到應用,證明為什麼我們可以信任它們的輸出,並明確何時不應信任它們,變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是,要求系統對其輸出產生一種解釋,這種解釋對人類或另一個受信任的系統來說是可讀的,即可以完全理解以至於任何可能的錯誤都可以被發現。例如,為了建立對司法系統的信任,我們要求法院提供清晰易讀的書面意見,解釋並支持其決策。對於大型語言模型來說,我們也可以採用類似的方法。不過,在採用這種方法時,確保語言模型生

基於Rust的Zed編輯器已開源,內建對OpenAI和GitHub Copilot的支持 基於Rust的Zed編輯器已開源,內建對OpenAI和GitHub Copilot的支持 Feb 01, 2024 pm 02:51 PM

作者丨TimAnderson編譯丨諾亞出品|51CTO技術堆疊(微訊號:blog51cto)Zed編輯器專案目前仍處於預發布階段,已在AGPL、GPL和Apache許可下開源。此編輯器以高性能和多種AI輔助選擇為特色,但目前僅適用於Mac平台使用。內森·索博(NathanSobo)在一篇貼文中解釋道,Zed專案在GitHub上的程式碼庫中,編輯器部分採用了GPL許可,伺服器端元件則使用了AGPL許可證,而GPUI(GPU加速用戶介面)部分則採用了Apache2.0授權。 GPUI是Zed團隊開發的一款

本地運作效能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服務,太方便了! 本地運作效能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服務,太方便了! Apr 15, 2024 am 09:01 AM

Ollama是一款超實用的工具,讓你能夠在本地輕鬆運行Llama2、Mistral、Gemma等開源模型。本文我將介紹如何使用Ollama實現對文本的向量化處理。如果你本地還沒有安裝Ollama,可以閱讀這篇文章。本文我們將使用nomic-embed-text[2]模型。它是一種文字編碼器,在短的上下文和長的上下文任務上,效能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。啟動nomic-embed-text服務當你已經成功安裝好o

沒等來OpenAI,等來了Open-Sora全面開源 沒等來OpenAI,等來了Open-Sora全面開源 Mar 18, 2024 pm 08:40 PM

不久前OpenAISora以其驚人的視訊生成效果迅速走紅,在一眾文生視訊模型中突顯重圍,成為全球矚目的焦點。繼2週前推出成本直降46%的Sora訓練推理復現流程後,Colossal-AI團隊全面開源全球首個類Sora架構視頻生成模型“Open-Sora1.0”,涵蓋了整個訓練流程,包括數據處理、所有訓練細節與模型權重,攜手全球AI熱愛者共同推動影片創作的新紀元。先睹為快,我們先看一段由Colossal-AI團隊發布的「Open-Sora1.0」模型生成的都市繁華掠影影片。 Open-Sora1.0

微軟、OpenAI 計畫 1 億美元投向人形機器人!網友紛紛喊話馬斯克 微軟、OpenAI 計畫 1 億美元投向人形機器人!網友紛紛喊話馬斯克 Feb 01, 2024 am 11:18 AM

微軟、OpenAI開年被曝預將大筆資金砸向人形機器人新創公司。其中,微軟計畫掏出9,500萬美元,OpenAI跟投500萬美元。彭博社消息稱,這家公司本輪預計共融資5億美元,投前估值或將達19億美元。是什麼吸引了他們?不妨先來看看這家公司的機器人成果。只見這個機器人通體銀黑,外觀酷似好萊塢科幻大片中的機器人形象:現在,他正在將一顆咖啡膠囊放進咖啡機裡:如果沒放正,還會自主調整,無需任何人為遠程遙控:不過一會兒,一杯咖啡就可以端走享用:有木有家人們已經認出來了,沒錯,這款機器人就是前段時間

高效率的Java爬蟲實戰:網頁資料抓取技巧分享 高效率的Java爬蟲實戰:網頁資料抓取技巧分享 Jan 09, 2024 pm 12:29 PM

Java爬蟲實戰:如何有效率地抓取網頁資料引言:隨著網路的快速發展,大量有價值的資料儲存在各種網頁中。而要獲取這些數據,往往需要手動訪問每個網頁並逐一提取信息,這無疑是一項繁瑣且耗時的工作。為了解決這個問題,人們開發了各種爬蟲工具,其中Java爬蟲是最常用的之一。本文將帶領讀者了解如何使用Java編寫高效的網頁爬蟲,並透過具體程式碼範例來展示實踐。一、爬蟲的基

See all articles