Wir wissen, dass Huggingface eine bekannte Open-Source-Plattform im Bereich KI ist. Jeder und jede Institution kann auf dieser Plattform eigene Modelle und Datensätze veröffentlichen und nutzen, was der Branche Forschungskomfort bietet. Daher erfreut es sich im KI-Kreis großer Beliebtheit und seine beliebteste Transformer-Bibliothek hat auf GitHub 102.000 Sterne erhalten.
Allerdings hat kürzlich ein großes Modell, das von TII entwickelt und auf Huggingface veröffentlicht wurde, für große Kontroversen gesorgt. Das große Modell ist das 40-Milliarden-Parameter-Kausal-Decoder-Modell Falcon-40B, das auf den 1000B-Tokens von RefinedWeb trainiert und durch einen kuratierten Datensatz ergänzt wird. Auf der OpenLLM-Bestenliste von Huggingface steht es an erster Stelle und übertrifft unter anderem LLaMA, MPT, RedPajama und StableLM.
Leaderboard-Adresse: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
Obwohl das Falcon-40B-Modell selbst leistungsstark ist, folgt es dem Open-Source-Protokoll ist Es sorgte für Aufruhr im Open-Source-Kreis. Es ist unter einer Lizenz erhältlich, die die kommerzielle Nutzung erlaubt, der folgenden TII Falcon LLM-Lizenz.
Open-Source-Lizenz: https://huggingface.co/tiiuae/falcon-40b/blob/main/LICENSE.txt
Diese Lizenz basiert teilweise auf die Apache-Lizenz Version 2.0. Die Apache License 2.0-Vereinbarung stammt von der berühmten Apache Foundation und ist für kommerzielle Anwendungen geeignet. Benutzer können den Code bei Bedarf an ihre Bedürfnisse anpassen und ihn als Open-Source- oder kommerzielles Produkt veröffentlichen/verkaufen.
Aber jemand hat ein paar „Tricks“ über die TII Falcon LLM-Lizenz entdeckt. Der Twitter-Benutzer @natfriedman fasste die Gemeinsamkeiten und Unterschiede mit der Open-Source-Lizenz Apache License 2.0 zusammen. Sie sind sich insofern ähnlich, als beide eine weitreichende Erlaubnis zur Nutzung, Änderung und Verbreitung des lizenzierten Werks gewähren, die Einbeziehung des lizenzierten Textes und der Quellenangabe in Verteilungen verlangen und Haftungsbeschränkungen und Gewährleistungsausschlüsse beinhalten.
Aber der Unterschied besteht darin, dass die TII Falcon LLM-Lizenz die Zahlung von Lizenzgebühren für die kommerzielle Nutzung erfordert, sobald die Einkommensschwelle erreicht ist, während dies bei den meisten Open-Source-Lizenzen nicht der Fall ist. Die TII Falcon LLM-Lizenz unterliegt außerdem zusätzlichen Einschränkungen hinsichtlich der Veröffentlichung oder Verbreitung des Werks, z. B. der Anforderung der Nennung „Falcon LLM-Technologie vom Technology Innovation Institute“.
Außerdem erlaubt die TII Falcon LLM-Lizenz keine erneute Lizenzierung des Werks unter einer anderen Lizenz, wohingegen die meisten Open-Source-Lizenzen die Lizenzierung abgeleiteter Werke unter einer anderen Vereinbarung ermöglichen. Die TII Falcon LLM-Lizenz schließt zudem ausdrücklich die Lizenzierung bestimmter Versionen/Größen von Falcon LLM aus, wohingegen Open-Source-Lizenzen grundsätzlich für alle Versionen gelten.
Schließlich stellt die TII Falcon LLM-Lizenz zusätzliche Anforderungen an Änderungen sowohl am Quell- als auch am Objektcode, es sei denn, das kompilierte Modell wird verteilt. Kurz gesagt, diese Lizenz erlaubt die offene Nutzung und Änderung, behält aber gleichzeitig viele Eigentumsrechte.
@natfriedmans Ansicht wurde von vielen geteilt, und ein anderer Twitter-Nutzer @_msw_ wies ausdrücklich darauf hin, dass die proprietäre Lizenz auf der vertrauenswürdigen Apache-Lizenz 2.0 basierte und sie „Open Source“ nannte. (das nicht wirklich Open Source ist) ist falsch, die hart erkämpfte Glaubwürdigkeit und Marke der Apache Software Foundation auszunutzen.
Jemand hat noch einmal gefragt: Bedeutet das, dass Falcon-40B keine Open Source oder freie Software ist? @_msw_ antwortete, dass es sich weder um Open Source noch um freie Software handelt.
Einige Leute stimmen zu und glauben, dass die TII Falcon LLM-Lizenz überhaupt keine Open-Source-Lizenz ist, andere weisen jedoch darauf hin, dass die TII Falcon LLM-Lizenz „teilweise“ auf einer Open-Source-Vereinbarung basiert.
Leute, die sich in der Branche mit Open Source befassen, haben ihre Ansicht geäußert, dass die Änderung von Apache oder anderen Mainstream-Open-Source-Lizenzen keine Open Source oder gar eine ist Kernel öffnen.
Ist Falcon-40B Open Source, aber nicht vollständig Open Source? Leser von Machine Heart, was denken Sie?
Das obige ist der detaillierte Inhalt vonDas Top-Open-Source-Modell von Huggingface ist umstritten: Es ändert auf magische Weise das Apache-Protokoll und verlangt Geld, wenn es einen bestimmten Schwellenwert erreicht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!