Ces dernières années, les modèles de pré-formation à grande échelle ont été l'un des moteurs importants des percées dans le domaine de l'intelligence artificielle, accélérant le processus de développement de l'ingénierie et de la vulgarisation de l'intelligence artificielle, et devraient devenir la pierre angulaire d'une nouvelle génération d'intelligence artificielle. technologie. Les percées dans les grands modèles d’intelligence artificielle découlent du développement continu de données de haute qualité. L’amélioration de la capacité à fournir des données de haute qualité est la clé pour promouvoir l’innovation dans le domaine des grands modèles d’intelligence artificielle générale
.Dans une étude importante réalisée en 2020, il a été constaté qu'il existe une loi de développement de loi de puissance entre l'effet du modèle et ses paramètres, données et quantité de calcul, à savoir les « lois d'échelle ». Les paramètres, les données et la quantité de calcul du modèle augmentent de façon exponentielle, tandis que la perte du modèle sur l'ensemble de test diminue de façon exponentielle, indiquant que les performances du modèle sont meilleures
En d'autres termes, lorsque la quantité de calcul est fixe et l'échelle des paramètres est petite, l'impact de l'augmentation du nombre de paramètres du modèle sur les performances du modèle dépasse de loin la contribution de la quantité de données et du nombre de temps d'entraînement
Par conséquent, l'industrie reconnaît généralement que les performances d'un modèle sont directement proportionnelles à ses paramètres et à sa capacité, c'est-à-dire que plus le modèle a de paramètres et de capacité, meilleures sont les performances
Selon le développement et les tendances futures de la chaîne industrielle de l'IA, la taille du marché de l'industrie chinoise des services de données d'IA augmente progressivement. À mesure que la demande de données de formation augmente et que les exigences en matière de normes de service augmentent, la division professionnelle du travail dans la chaîne industrielle devient plus claire
Jia Yuhang a souligné lors de l'événement Youth Pioneer Forum que la qualité des données d'IA est un facteur clé de l'intelligence artificielle, qui affecte directement les résultats finaux des grands modèles. Plus la quantité et la qualité des données sont élevées, plus le modèle peut être entièrement entraîné et les performances optimisées, et meilleures seront les performances. Par conséquent, les données d’IA de haute qualité fourniront des capacités de service plus puissantes pour les applications d’intelligence artificielle
Jia Yuhang a déclaré que les données de mesure des nuages présentent de nombreux avantages pour répondre à la demande de données de haute qualité pour les grands modèles. Ils considèrent la qualité des données comme le cœur des services de données d'IA. Ils se concentrent non seulement sur l'optimisation de la recherche et du développement technologique, mais s'étendent également à la formation des talents et aux services de produits pour fournir aux entreprises des services de données d'IA de haute qualité basés sur des scénarios. Au niveau commercial, ils introduisent le traitement des données d'IA dans les entreprises via la collecte, le nettoyage et l'annotation des données, et fournissent des interfaces API standard pour prendre en charge l'importation et l'exportation des données, ainsi que des fonctions de pré-annotation pour les algorithmes existants. Ils peuvent fournir plusieurs applications de produits de données d'IA et services de données d'IA, se connecter à la base de données de n'importe quelle entreprise, accumuler rapidement le processus des données brutes aux données annotées et accélérer le processus de développement des modèles d'IA
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!