Kai-fu Lee, président-directeur général de Sinovation Ventures, a fondé cette année la startup à grand modèle d'IA "Zero One Everything". La société a publié deux grands modèles open source, Yi-34B et Yi-6B, et prétend être totalement ouverte à la recherche universitaire et autorise des applications commerciales gratuites
Sur la page d'accueil open source de Hugging Face, Ehartford, le développeur du modèle Yi-34B, a soulevé des questions, affirmant que le modèle utilise l'architecture Meta LLaMA et n'a modifié que les noms de deux tenseurs (Tensor), qui sont input_layernorm et post_attention_layernorm
ehartford a déclaré que la communauté open source rééditerait certainement le grand modèle Yi et renommerait les tenseurs pour se conformer à l'architecture LLaMA. Il espère que l'entreprise envisagera de mettre en œuvre le changement dans le modèle officiel avant qu'il ne soit adopté massivement, ce qui suscitera beaucoup de discussions ci-dessous.
De plus, IT House a découvert qu'une photo de Jia Yangqing, l'ancien scientifique en chef de l'IA d'Alibaba, a été diffusée sur Internet aujourd'hui. Le contenu indiquait qu'« un nouveau modèle d'un grand fabricant national est exactement l'architecture de LLaMA, mais ». afin d'exprimer la différence, le nom dans le code est modifié. " J'ai changé le nom de LLaMA en leurs noms, puis j'ai changé quelques noms de variables. "
Selon les rapports d'IT House, pour l'instant, Zero One Thousand Things n'a pas officiellement répondu
Jia Yangqing a annoncé sa démission d'Alibaba en mars de cette année et a cofondé une nouvelle société d'IA, Lepton AI, aux États-Unis, dans le but de créer une plate-forme d'applications d'IA efficace.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!