Huggingface が AI の分野でよく知られたオープン ソース プラットフォームであることはわかっています。誰でも各機関が独自のモデルやデータ セットをプラットフォーム上で公開し、他の人のモデルやデータ セットを使用できるため、業界に研究の利便性が提供されます。 。そのため、AI サークルに深く愛されており、最も人気のある Transformer ライブラリは GitHub で 102,000 個のスターを獲得しています。
しかし、最近、TII が開発し、Huggingface で公開された大規模なモデルが広範な論争を引き起こしました。大規模モデルは 400 億パラメータの因果デコーダー モデル Falcon-40B で、RefinedWeb の 1000B トークンでトレーニングされ、厳選されたデータセットで強化されています。 Huggingface の OpenLLM リーダーボードでは、LLaMA、MPT、RedPajama、StableLM などを上回り、1 位にランクされています。
ランキングリストアドレス:https://huggingface.co/spaces/HuggingFaceH4 /open_llm_leaderboard
Falcon-40B モデル自体は強力ですが、それに準拠するオープン ソース プロトコルはオープン ソース サークルで大騒動を引き起こしました。これは、商用利用を許可するライセンス (以下の TII Falcon LLM ライセンス) に基づいて利用できます。
オープンソース契約: https://huggingface.co/tiiuae/ falcon -40b/blob/main/LICENSE.txt
このライセンスは、部分的に Apache ライセンス バージョン 2.0# に基づいています。 ####。 Apache License 2.0 契約は有名な Apache Foundation からのものであり、商用アプリケーションに適しています。ユーザーは、ニーズに合わせて必要に応じてコードを変更し、オープンソースまたは商用製品として公開/販売できます。 しかし、誰かが
TII Falcon LLM ライセンス のいくつかの「トリック」を発見しました。 Twitter ユーザー @natfriedman は、Apache License 2.0 オープンソース ライセンスとの類似点と相違点をまとめました。どちらも、ライセンスされた作品の使用、変更、配布に対する広範な許可を与え、配布物にライセンスされたテキストと帰属を含めることを要求し、責任の制限と保証の免責事項を伴うという点で似ています。 ただし、違いは、TII Falcon LLM ライセンスでは、収益基準に達すると商用利用ロイヤルティの支払いが必要であるのに対し、ほとんどのオープンソース ライセンスではその必要がないことです。 TII Falcon LLM ライセンスには、「Technology Innovation Institute の Falcon LLM テクノロジー」への帰属を要求するなど、作品の公開または配布方法に関する追加の制限もあります。
また、TII Falcon LLM ライセンスでは、別のライセンスに基づいて作品を再ライセンスすることはできませんが、ほとんどのオープン ソース ライセンスでは、別の契約に基づいて派生作品にライセンスを与えることができます。 TII Falcon LLM ライセンスでは、Falcon LLM の特定のバージョン/サイズがライセンスの対象から明示的に除外されていますが、オープン ソース ライセンスは通常、すべてのバージョンに適用されます。
最後に、TII Falcon LLM ライセンスでは、コンパイルされたモデルが配布されない限り、ソース コードとオブジェクト コードの両方への変更に追加の要件が課されます。つまり、このライセンスはオープンな使用と変更を許可しますが、同時に多くの所有権を保持します。
@natfriedman 氏の感情は多くの人に共感され、別の Twitter ユーザー @_msw_ は率直に次のように指摘しました。
信頼できる Apache License 2.0 に基づく独自のライセンスをベースにし、それを「オープン ソース」(実際には真のオープン ソースではありません) と呼ぶことは、Apache Software Foundation を使用して、苦労して獲得した信頼性とブランド慣行が間違っています。 誰かがもう一度質問しました。これは、Falcon-40B がオープンソースまたはフリー ソフトウェアではないことを意味しますか? @_msw_ は、オープンソースでもフリーソフトウェアでもないと答えました。
TII Falcon LLM ライセンスはまったくオープンソース ライセンスではないと同意し、考えている人もいますが、次のように指摘する人もいます。 TII Falcon の LLM ライセンスは「部分的に」オープンソース契約に基づいています。
#Falcon-40B はオープンソースですが、完全にオープンソースではありませんか? 『マシンハート』読者の皆さんはどう思いますか?
以上がハギングフェイスのトップオープンソースモデルは物議を醸している:Apacheプロトコルを魔法のように変更し、一定のしきい値に達すると料金を請求するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。