许多主要新闻媒体正屏蔽 OpenAI 爬虫-人工智能-PHP中文网

首页

科技周边

人工智能

许多主要新闻媒体正屏蔽 OpenAI 爬虫

PHPz

Feb 29, 2024 am 10:10 AM

openai 爬虫

自OpenAI推出内容生成式人工智能模型以来，网络上的数据被广泛应用于训练和改进这些模型。然而，根据路透社研究所的调查显示，越来越多的新闻媒体开始对OpenAI的数据采集表示疑虑，甚至有超过50%的传统媒体对此持反对态度。这表明对数据隐私和使用的关注正在增加，并提醒人们在人工智能发展过程中需要更多的透明度和合规性。

路透社研究所分析了《纽约时报》、《华尔街日报》、《华盛顿邮报》、CNN、NPR 等多家主流新闻媒体，涵盖美国、英国、德国、印度等10个国家，并将其归为传统印刷媒体（纸媒）、广播电视媒体、数字媒体三大类。研究发现，57%的传统印刷媒体屏蔽了OpenAI 的爬虫程序，广播电视媒体和数字媒体的比例分别为48%和 31%。

研究还指出，不同国家和地区屏蔽 OpenAI 的新闻网站比例存在显着差异。在美国，这一比例高达79%，而在墨西哥和波兰则仅为20%。

许多主要新闻媒体正屏蔽 OpenAI 爬虫

所研究调查的10个国家新闻媒体对 OpenAI爬虫采取屏蔽措施的比例差异

此外，在屏蔽了OpenAI 爬虫的新闻媒体中，有97%也同样屏蔽了谷歌人工智能的爬虫。

某些研究揭示了新闻媒体对人工智能使用其内容持谨慎态度。他们担心，如果人们通过人工智能获取新闻，可能导致媒体被边缘化或替代。 Gartner副总裁兼杰出分析师安德鲁·弗兰克指出：“路透社的研究突显了生成式人工智能所面临的一个核心挑战：它的运作依赖于真实个体创造的真实内容，而这些个体可能视之为对其谋生方式的潜在威胁。”

近期，康奈尔大学的一项研究指出，当新的人工智能模型在训练过程中主要依赖于先前模型而非人类提供的数据时，往往会出现“模型崩溃”或退化的情况。这导致人工智能系统生成的信息中出现更多错误。这一现象突显了在人工智能领域中存在的潜在风险和挑战，需要更深入的研究和探讨。这项研究结果提醒我们，在开发人工智能技术时要谨慎对待数据来源和训练方法，以

去年8月初，OpenAI推出了人工智能爬虫，随后谷歌也在9月推出了类似产品。研究指出，如果这些媒体做出了屏蔽决定，可能会很难逆转这一立场并解除屏蔽。

以上是许多主要新闻媒体正屏蔽 OpenAI 爬虫的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7697

Java教程

1640

CakePHP 教程

1393

Laravel 教程

1287

PHP教程

1229

显示更多

Related knowledge

编程新范式，当Spring Boot遇上OpenAI Feb 01, 2024 pm 09:18 PM

2023年，AI技术已经成为热点话题，对各行业产生了巨大影响，编程领域尤其如此。人们越来越认识到AI技术的重要性，Spring社区也不例外。随着GenAI（GeneralArtificialIntelligence）技术的不断进步，简化具备AI功能的应用程序的创建变得至关重要和迫切。在这个背景下，"SpringAI"应运而生，旨在简化开发AI功能应用程序的过程，使其变得简单直观，避免不必要的复杂性。通过"SpringAI"，开发者可以更轻松地构建具备AI功能的应用程序，将其变得更加易于使用和操作

选择最适合数据的嵌入模型：OpenAI 和开源多语言嵌入的对比测试 Feb 26, 2024 pm 06:10 PM

OpenAI最近宣布推出他们的最新一代嵌入模型embeddingv3，他们声称这是性能最出色的嵌入模型，具备更高的多语言性能。这一批模型被划分为两种类型：规模较小的text-embeddings-3-small和更为强大、体积较大的text-embeddings-3-large。这些模型的设计和训练方式的信息披露得很少,模型只能通过付费API访问。所以就出现了很多开源的嵌入模型但是这些开源的模型与OpenAI闭源模型相比如何呢？本文将对这些新模型与开源模型的性能进行实证比较。我们计划建立一个数据

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是，要求系统对其输出产生一种解释，这种解释对人类或另一个受信任的系统来说是可读的，即可以完全理解以至于任何可能的错误都可以被发现。例如，为了建立对司法系统的信任，我们要求法院提供清晰易读的书面意见，解释并支持其决策。对于大型语言模型来说，我们也可以采用类似的方法。不过，在采用这种方法时，确保语言模型生

基于Rust的Zed编辑器已开源，内置对OpenAI和GitHub Copilot的支持 Feb 01, 2024 pm 02:51 PM

作者丨TimAnderson编译丨诺亚出品|51CTO技术栈（微信号：blog51cto）Zed编辑器项目目前仍处于预发布阶段，已在AGPL、GPL和Apache许可下开源。该编辑器以高性能和多种AI辅助选择为特色，但目前仅适用于Mac平台使用。内森·索博（NathanSobo）在一篇帖子中解释道，Zed项目在GitHub上的代码库中，编辑器部分采用了GPL许可，服务器端组件则使用了AGPL许可证，而GPUI（GPU加速用户界面）部分则采用了Apache2.0许可。GPUI是Zed团队开发的一款

没等来OpenAI，等来了Open-Sora全面开源 Mar 18, 2024 pm 08:40 PM

不久前OpenAISora以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继2周前推出成本直降46%的Sora训练推理复现流程后，Colossal-AI团队全面开源全球首个类Sora架构视频生成模型「Open-Sora1.0」，涵盖了整个训练流程，包括数据处理、所有训练细节和模型权重，携手全球AI热爱者共同推进视频创作的新纪元。先睹为快，我们先看一段由Colossal-AI团队发布的「Open-Sora1.0」模型生成的都市繁华掠影视频。Open-Sora1.0

微软、OpenAI 计划 1 亿美元投向人形机器人！网友纷纷喊话马斯克 Feb 01, 2024 am 11:18 AM

微软、OpenAI开年被曝预将大笔资金砸向一家人形机器人初创公司。其中，微软计划掏出9500万美元，OpenAI跟投500万美元。彭博社消息称，这家公司本轮预计共要融资5亿美元，投前估值或将达到19亿美元。是什么吸引了他们？不妨先来看一下这家公司的机器人成果。只见这个机器人通体银黑，外观酷似好莱坞科幻大片中的机器人形象：现在，他正在将一颗咖啡胶囊放进咖啡机里：如果没放正，还会自主调整，无需任何人为远程遥控：不过一会儿，一杯咖啡就可以端走享用：有木有家人们已经认出来了，没错，这款机器人就是前段时间

本地运行性能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服务，太方便了！ Apr 15, 2024 am 09:01 AM

Ollama是一款超级实用的工具，让你能够在本地轻松运行Llama2、Mistral、Gemma等开源模型。本文我将介绍如何使用Ollama实现对文本的向量化处理。如果你本地还没有安装Ollama，可以阅读这篇文章。本文我们将使用nomic-embed-text[2]模型。它是一种文本编码器，在短的上下文和长的上下文任务上，性能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。启动nomic-embed-text服务当你已经成功安装好o

高效的Java爬虫实战：网页数据抓取技巧分享 Jan 09, 2024 pm 12:29 PM

Java爬虫实战：如何高效抓取网页数据引言：随着互联网的快速发展，大量有价值的数据被存储在各种网页中。而要获取这些数据，往往需要手动访问每个网页并逐一提取信息，这无疑是一项繁琐且耗时的工作。为了解决这个问题，人们开发了各种爬虫工具，其中Java爬虫是最常用的之一。本文将带领读者了解如何使用Java编写高效的网页爬虫，并通过具体代码示例来展示实践。一、爬虫的基

See all articles

许多主要新闻媒体正屏蔽 OpenAI 爬虫

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题