Maison > développement back-end > Tutoriel Python > Problème de tailles de tenseurs incompatibles lors de l'entraînement avec DeepSpeed

Problème de tailles de tenseurs incompatibles lors de l'entraînement avec DeepSpeed

DDD
Libérer: 2024-12-23 18:32:14
original
612 Les gens l'ont consulté

Issue with mismatched tensor sizes during training with DeepSpeed

J'entraîne actuellement un modèle à l'aide de** Hugging Face**'s Trainer avec intégration DeepSpeed, et je rencontre une erreur liée à des tailles de tenseurs incompatibles. Plus précisément, j'obtiens l'erreur suivante :

La taille du tenseur a (50) doit correspondre à la taille du tenseur b (3) à la dimension non singleton2

J'espère que quelqu'un pourra le réparer et partager votre version s'il vous plaît !???

mes données :

Voici ma configuration :

J'ai vérifié que les input_ids et les labels ont la même forme. J'ai vérifié la taille du lot dans la configuration Trainer et la configuration DeepSpeed. Je me suis également assuré que le modèle est correctement placé sur l'appareil (cuda ou cpu).

peut-être, je ne suis pas sûr.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:dev.to
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal