AI オープンソースの問題について話すときが来ました。
明らかに、これは開発者が直面しなければならない問題です。基本的に 2006 年以来、オープンソースの問題は最重要課題の 1 つになりました。
Matt Asay は、MongoDB のマーケティング責任者です。それ以前は、Amazon Web Services の責任者および Adobe の開発者エコシステムの責任者を務めていました。
Asay は、Adobe に入社する前、オープンソース企業で一連の役職を歴任しました。 MongoDB のビジネス開発、マーケティング、コミュニティ担当副社長、リアルタイム分析会社 Nodeable (後に Appcelerator に買収) のビジネス開発担当副社長、モバイル HTML5 スタートアップの Strobe (後に Facebook に買収) のビジネス開発担当副社長および暫定 CEO、Ubuntu Canonical 社の Linux COO であり、コンテンツ管理スタートアップ Alfresco の南北アメリカ部門責任者。
最終的に、Asay は Open Source Initiative (OSI) の名誉ディレクターとなり、スタンフォード大学で法学博士号を取得しました。
以前、Matt Asay は Google と Yahoo がオープンソース コードに対して留保していると非難し、その後叱られました。
今考えてみると、それは当然です。
Tim O'Reilly 氏は、オープンソース クラウドの時代において、開発者がコードを共有する動機は、他の人に独自のプログラムを実行させ、それによってソース コードのコピーを提供することであると述べました。そしてその必要性は徐々に消えていきました。
## Reilly 氏は続けて、これは不必要であるだけでなく、大規模なアプリではもはや不可能であると指摘します。 過去 10 年にわたり、この共有の不可能性により、オープンソースの本来の定義が覆されました。今日、新しい定義が人工知能に関する私たちの考え方に影響を与えています。 Mike Loukides が指摘しているように、AI に関するコラボレーションはかつてないほど重要になっており、また、これほど困難になったこともありません。 2006 年のクラウド コンピューティングと同じように、人工知能で最も興味深い研究を行っている企業は、おそらく従来の方法でオープンソース化に努めることになるでしょう。 しかし、たとえ彼らのオープンソース手法が伝統的だったとしても、それは彼らがより有意義な方法でオープンにできないという意味ではありません。 オープン インフラストラクチャ Loukides 氏は次のように考えています。 Meta、OpenAI、Google の 3 社だけです。」 この 3 社には 1 つの共通点があります。それは、いずれも大規模なモデルを大規模に実行できる能力を持っているということです。この能力の背後には強力なインフラストラクチャと技術的手段が必要ですが、多くの個人や企業がそれらを持っていないことがよくあります。 OPT-175B のソース コードを Meta からダウンロードできるのは事実ですが、手持ちのハードウェアでは OPT-175B をトレーニングできません。大学などの研究機関にとっても、OPT-175Bは大きすぎます。 一方、十分なコンピューティングリソースを有する Google や OpenAI ですら、OPT-175B を簡単に再現することはできません。 理由も非常に単純です。OPT-175B は Meta 独自のインフラストラクチャ (カスタム ハードウェアを含む) と密接に接続されているため、他の場所に移植するのが困難です。言い換えれば、Meta は OPT-175B について何も隠そうとしているわけではありませんが、同様のインフラストラクチャを構築するのは非常に困難です。たとえお金と技術を持っている人であっても、最終的には別のバージョンになります。
そして、それはまさに、Yahoo の Jeremy Zawodny と Google の Chris DiBona が OSCON 2006 で述べたことです。
しかし、繰り返しになりますが、マシン内部の科学原理を理解していなければ、AI を信頼するのは困難です。
したがって、インフラストラクチャをオープンに使用できるようにする何らかの方法を見つける必要があります。
Loukides は、外部の研究者や早期採用者に無料のアクセスが提供されるべきだと考えています。ただし、これは Meta、Google、または OpenAI のデータセンターにアクセスするためのマスターキーを与えるのとは異なり、パブリック API を通じて行われます。
これは、ほとんどの人が期待する「オープンソース」ではないかもしれませんが、実際には許容されます。
さて、Google と Yahoo に対する Matt Asay の非難は無意味です。
2006 年以来、Google は戦略的ニーズを満たすために重要なインフラストラクチャをパッケージ化し、オープンソース化してきました。
Matt Asay 氏の見解では、TensorFlow はオープンソースへの入り口であり、Kubernetes はオープンソースへの出口です。これらのオープンソースの機械学習業界標準により、Google Cloud のワークロードが改善されたり、Google Cloud 間の移植性が確保されたりすることで、より多くのワークロードが Google Cloud に取り込まれることが期待されています。
これを考え出した人々は賢いですが、Pollyanna の意味でのオープンソースではありません。
Google だけではありません。他の企業よりもオープンソースをうまくやっているだけです。オープンソースは本質的に利己的であり、企業や個人は常に自分自身や顧客に利益をもたらすコードを公開します。
これまでも、そしてこれからもそうあります。
Loukides 氏は、AI は有意義な方法でオープンであるべきだと信じています (AI 大手 3 社と他の企業の間には違いがありますが)。しかし、彼が言及するオープンソースは、次の分野におけるオープンソースではありません。私たちの一般的な感覚。なぜ?
その理由は、従来のオープンソースは素晴らしいものですが、ソフトウェアの作成者と消費者の両方にとって、2006 年の OSCON で DiBona と Zawodny が提案した問題を解決できていないからです。クラウドのオープンソースの問題。
10年以上が経過しましたが、まだ答えには近づいていません。
そしてまた、私たちは確かにもう少し近づいています。
Matt Asay は、オープンソースを新しい視点で見る必要があると信じています。
彼はルキデスの考え方に近いです。鍵となるのは、研究者に十分なアクセスを提供して、特定の研究がどのように行われるかを発見できるようにすることです。 AI モデルが成功するか失敗するか。
「これらのモデルを実行するために、すべてのコードとインフラストラクチャに完全にアクセスする必要はありません。」彼が言うように、コードへの完全なアクセスは、開発者がラップトップでオープンソース プログラムを実行し、派生作品を作成できる場合にのみ意味を持ちます。
今日 Google や Microsoft が実行するコードの規模と独特の複雑さを考えると、これは意味がありません。大規模なクラウド コードに完全にアクセスできるわけではありません。
私たちは理解する必要があります。オープンソースは、オープンソースの世界を見るためのレンズではありません。そして、今日私たちが生きているクラウド時代を考慮すると、オープンソースの使用はますます少なくなっています。
私たちの目標は、企業としても個人としても、数十年にわたるオープンソースの概念を再発明しようとするのではなく、顧客とサードパーティ開発者に利益をもたらす方法でソフトウェアへのアクセスを開放し、理解を容易にすることであるべきです。成雲前。 AI に適用されないのと同様、オープンソースにも適用されません。
考えを変える時期が来ました。
以上がAIはオープンソースには向かないのでしょうか? MongoDB 副社長: オープンソース コードは人工知能には適さないの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。