AI 오픈소스에 대해 이야기할 차례입니다.
분명히 이는 개발자가 직면해야 하는 문제입니다. 기본적으로 2006년부터 오픈소스 문제는 주요 이슈 중 하나로 자리 잡았습니다.
Matt Asay는 MongoDB에서 마케팅을 담당하고 있습니다. 그 전에는 Amazon Web Services의 책임자이자 Adobe의 개발자 생태계 책임자였습니다.
Asay는 Adobe에 합류하기 전에 오픈 소스 회사에서 여러 직책을 맡았습니다. MongoDB의 비즈니스 개발, 마케팅 및 커뮤니티 부사장, 실시간 분석 회사인 Nodeable(나중에 Appcelerator에 인수됨)의 비즈니스 개발 부사장, 모바일 HTML5 스타트업 Strobe(나중에 Facebook에 인수됨) 및 Ubuntu의 비즈니스 개발 부사장 겸 임시 CEO Canonical의 Linux COO이자 콘텐츠 관리 스타트업 Alfresco의 미주 지역 책임자입니다.
결국 Asay는 OSI(Open Source Initiative)의 명예 이사가 되었고 스탠포드 대학교에서 J.D.를 받았습니다.
이전에 Matt Asay는 Google과 Yahoo가 오픈 소스 코드에 대해 의구심을 갖고 있다고 비난한 후 야유를 받았습니다.
지금 생각해보면 이해가 되네요.
Tim O'Reilly는 오픈 소스 클라우드 시대에 개발자가 코드를 공유하는 동기는 다른 사람이 자신의 프로그램을 실행하도록 하여 소스 코드의 복사본을 제공하는 것이라고 말했습니다. 그리고 이에 대한 필요성은 점차 사라졌습니다.
Reilly는 계속해서 이것이 필요하지 않을 뿐만 아니라 가장 큰 앱에 관한 한 더 이상 가능하지 않다고 지적합니다.
지난 10년 동안 이러한 공유 불가능성은 오픈 소스의 원래 정의를 뒤집어 놓았습니다. 오늘날 새로운 정의는 우리가 인공 지능에 대해 생각하는 방식에 영향을 미치고 있습니다.
Mike Loukides가 지적했듯이 AI 분야의 협업이 지금보다 더 중요하거나 어려운 적은 없었습니다.
2006년의 클라우드 컴퓨팅과 마찬가지로 인공지능 분야에서 가장 흥미로운 작업을 수행하는 기업은 아마도 전통적인 방식으로 소스를 오픈하려고 노력할 것입니다.
하지만 오픈 소스 접근 방식이 전통적이라고 해서 더 의미 있는 방식으로 공개할 수 없다는 의미는 아닙니다.
Loukides는 다음과 같이 믿습니다. "현재 많은 회사가 AI를 수행하고 있다고 말하지만 실제로 업계를 발전시키고 있는 회사는 Meta, OpenAI 및 Google 세 회사뿐입니다."
세 회사는 단 세 곳뿐입니다. 이들 중 한 가지 공통점은 모두 대규모 모델을 대규모로 실행할 수 있다는 것입니다. 이러한 능력 뒤에는 많은 개인과 기업이 갖고 있지 않은 강력한 인프라와 기술적 수단이 필요합니다.
메타에서 OPT-175B의 소스 코드를 다운로드할 수 있는 것은 사실이지만, 보유하고 있는 하드웨어로는 이를 훈련시킬 수 없습니다. 대학이나 기타 연구 기관에서도 OPT-175B는 너무 큽니다.
한편, 충분한 컴퓨팅 자원을 갖고 있는 Google이나 OpenAI라도 OPT-175B를 쉽게 재현할 수는 없습니다.
이유도 간단합니다. OPT-175B는 Meta 자체 인프라(맞춤형 하드웨어 포함)와 너무 밀접하게 연결되어 있어 다른 곳에 이식하기 어렵습니다.
즉 메타는 OPT-175B에 대해 아무것도 숨기려고 하지 않지만 유사한 인프라를 구축하는 것은 정말 어렵습니다. 돈과 기술이 있는 사람이라도 최종 결과는 다를 것입니다.
이것이 바로 Yahoo의 Jeremy Zawodny와 Google의 Chris DiBona가 OSCON 2006에서 만든 것입니다.
하지만 기계 내부의 과학적 원리를 이해하지 못하면 AI를 신뢰하기 어렵습니다.
그래서 인프라를 개방적으로 사용할 수 있는 방법을 찾아야 합니다.
Loukides는 외부 연구원과 얼리 어답터에게 무료 액세스가 제공되어야 한다고 믿습니다. 그러나 이는 Meta, Google 또는 OpenAI의 데이터 센터에 액세스할 수 있는 마스터 키를 제공하는 것이 아니라 공개 API를 통해 제공하는 것과 같습니다.
이것은 대부분의 사람들이 기대하는 "오픈 소스"가 아닐 수도 있지만 실제로는 허용됩니다.
이제 Matt Asay가 Google과 Yahoo를 상대로 한 비난은 이제 의미가 없습니다.
2006년부터 Google은 전략적 요구 사항을 충족하기 위해 중요 인프라를 패키지화하고 오픈소스화해 왔습니다.
Matt Asay의 관점에서 TensorFlow는 오픈 소스로의 입구이고 Kubernetes는 오픈 소스로의 출구입니다. 이러한 오픈소스 기계 학습 산업 표준은 Google Cloud 워크로드를 개선하거나 Google Cloud 간 이동성을 보장하여 Google Cloud로 더 많은 워크로드를 확보할 것으로 예상됩니다.
이것을 생각해낸 사람은 똑똑하지만 Pollyanna 관점에서 볼 때 오픈 소스는 아닙니다.
이런 것은 구글만이 아닙니다. 다른 회사보다 오픈소스를 더 잘할 뿐입니다. 오픈 소스는 본질적으로 이기적이며 기업과 개인은 항상 자신이나 고객에게 이익이 되는 코드를 공개합니다.
항상 그랬고 앞으로도 그럴 것입니다.
Loukides는 AI가 의미 있는 방식으로 개방되어야 한다고 믿습니다(3대 AI 거대 기업과 다른 기업 간의 차이에도 불구하고). 그러나 그가 언급하는 오픈 소스는 우리의 일반적인 의미의 오픈 소스가 아닙니다. 왜?
그 이유는 전통적인 오픈 소스가 소프트웨어 제작자와 소비자 모두에게 훌륭하지만 2006년 OSCON에서 DiBona와 Zawodny가 제기한 클라우드 오픈 소스 난제를 성공적으로 해결한 적이 없기 때문입니다.
10년 이상이 흘렀지만 여전히 답에 가까워지지 않았습니다.
그러면 또 우리는 정말 조금 더 가까워졌습니다.
Matt Asay는 오픈 소스를 새로운 방식으로 바라볼 필요가 있다고 믿습니다.
그는 Loukides의 생각에 가깝습니다. 핵심은 연구원들이 특정 AI 모델이 어떻게 성공하거나 실패하는지 재현할 수 있도록 충분한 액세스 권한을 제공하는 것입니다.
"이러한 모델을 실행하기 위해 모든 코드와 인프라에 대한 전체 액세스 권한이 필요하지 않습니다." 그가 말했듯이 코드에 대한 완전한 액세스는 개발자가 랩톱에서 오픈 소스 프로그램을 실행하고 파생 작품을 만들 수 있는 경우에만 의미가 있습니다.
현재 Google이나 Microsoft에서 실행하는 코드의 규모와 고유한 복잡성을 고려하면 이는 더 이상 의미가 없습니다. 대규모로 클라우드 코드에 완전히 액세스하는 것은 불가능합니다.
우리는 이해해야 합니다. 오픈 소스는 오픈 소스 세계를 보는 렌즈가 아닙니다. 그리고 오늘날 우리가 살고 있는 클라우드 시대를 고려할 때 오픈 소스의 사용은 점점 줄어들고 있습니다.
회사로서나 개인으로서 우리의 목표는 수십 년 된 오픈 소스 개념을 새로운 오픈 소스 개념으로 바꾸려고 하기보다는 고객과 제3자 개발자에게 이익이 되는 방식으로 소프트웨어에 대한 액세스를 개방하여 소프트웨어를 더 쉽게 이해하도록 하는 것입니다. 구름 . AI에 적용되지 않는 것처럼 오픈소스에도 적용되지 않습니다.
이제 마음을 바꿔야 할 때입니다.
위 내용은 AI는 오픈소스에 적합하지 않나요? MongoDB 부사장: 오픈소스 코드는 인공지능에 적합하지 않습니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!