Reddit CEO: Microsoft와 다른 회사는 데이터 스크랩에 비용을 지불해야 합니다

WBOY
풀어 주다: 2024-08-01 15:17:23
원래의
720명이 탐색했습니다.

8월 1일 이 웹사이트의 소식에 따르면 Reddit CEO인 Steve Hoffman은 최근 Microsoft와 같은 회사가 웹사이트의 데이터를 계속 크롤링하려면 비용을 지불해야 한다고 밝혔습니다. Reddit은 이전에 Google 및 OpenAI와 계약을 체결했습니다.

Reddit CEO:微软等公司必须付费才能抓取数据

Pexels를 통한 이미지
Pexels를 통한 이미지
Hoffman은 이러한 계약이 없으면 Reddit은 데이터가 사용되는 방식에 대한 통제권이나 가시성이 없으므로 데이터가 사용되는 조건을 수락하지 않는 회사를 차단할 수밖에 없다고 지적했습니다. 그는 협상을 거부한 마이크로소프트(Microsoft), 앤트로픽(Anthropic), 퍼플렉시티(Perplexity) 등 3개 기업을 꼽으며 이들을 차단하는 것은 "매우 골치 아픈 일"이라고 말했다.
최근 몇 달 동안 Reddit은 스크레이퍼를 단속하기 위한 노력을 강화해 왔습니다. 7월 초 Reddit은 승인되지 않은 웹 크롤러를 차단하기 위해 robots.txt 파일을 업데이트했습니다. 나중에 Reddit 콘텐츠가 Google 검색 결과에만 표시되고 Bing과 같은 다른 검색 엔진에는 표시되지 않는다는 사실이 밝혀졌습니다.
Hoffman은 Microsoft가 승인 없이 Reddit 데이터를 사용하여 AI를 교육하고 Bing 검색 결과에 Reddit 콘텐츠를 요약하며 Bing API를 통해 이 데이터를 다른 검색 엔진에 판매한다고 비난했습니다. 그는 또한 마이크로소프트 AI 책임자인 무스타파 술레이만(Mustafa Suleiman)이 이전에 인터넷 공개 데이터가 “자유 소프트웨어”라고 말한 것에 대해 마이크로소프트와 같은 기업들은 인터넷의 모든 콘텐츠를 무료로 사용할 수 있다고 믿고 있으며 이것이 그들의 진정한 입장이라고 말했습니다.
이 사이트에서는 Bing에서 Reddit 검색 결과가 사라진 것에 대해 Microsoft 검색 책임자인 Jody Ribas가 소셜 미디어에서 Reddit이 Bing의 크롤러를 차단하고 다른 검색 엔진을 선호하여 Bing 및 Bing 기반 검색 엔진 경쟁에 영향을 미친다고 밝혔습니다. 마이크로소프트 대변인 케이틀린 로튼(Caitlin Lawton)은 또한 자사의 콘텐츠가 생성 AI 모델에 사용되지 않기를 원하는 웹사이트의 의사를 회사가 존중한다고 말했습니다.
Hoffman은 OpenAI의 SearchGPT를 예로 들어 유료 계약의 중요성을 강조했습니다. 올해 초 Reddit과 OpenAI는 SearchGPT가 Reddit 콘텐츠를 표시하도록 허용하는 데 합의했습니다. Reddit 대변인 Tim Rutschmidt는 현재의 콘텐츠 라이센스 계약 중 어느 것도 독점적인 데이터 사용 권한을 포함하지 않는다고 말했습니다.
Reddit의 지불 요청은 생성 AI에 콘텐츠를 사용할 수 있도록 허용하여 수익을 얻기를 희망하는 기존 미디어 게시자와 유사합니다. 호프만은 검색 엔진의 전통적인 가치 교환이 바뀌었고 검색, 요약 및 교육이 통합되고 있으며 단순히 트래픽을 대가로 콘텐츠를 크롤링하는 모델이 흐려졌다고 믿습니다.

위 내용은 Reddit CEO: Microsoft와 다른 회사는 데이터 스크랩에 비용을 지불해야 합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:ithome.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿