Nouveauté du 9 octobre, les grands modèles d'IA ont été un sujet brûlant dans le domaine de l'intelligence artificielle ces dernières années. Ils peuvent réaliser diverses fonctions étonnantes, comme générer du texte et des images réalistes, ou communiquer en douceur avec les humains. dialogue. Mais derrière ces grands modèles se cache un groupe d’annotateurs de données inconnus qui travaillent dur chaque jour pour ajouter des étiquettes aux données brutes et fournir à la technologie de l’IA les données massives nécessaires à la formation.
Le travail des annotateurs de données n'est pas facile. Ils doivent faire face à des tâches ennuyeuses, à de faibles revenus, à une instabilité à long terme et au risque d'être remplacés à tout moment. Ils constituent la pierre angulaire du développement de la technologie de l’IA, mais reçoivent peu d’attention et de respect.
Selon "Tech Planet", les annotateurs de données utilisent le système de rémunération à la pièce le plus primitif pour calculer leur salaire La plupart des praticiens ne gagnent pas plus de 5 000 yuans par mois. Certaines d’entre elles sont diplômées d’université, d’autres sont mères et d’autres encore ont changé de carrière. Ils traitent des images, des textes, des voix et d'autres données dans des bureaux situés dans des villes de troisième et quatrième rang, fournissant ainsi des services aux grandes sociétés Internet et aux constructeurs automobiles.
Ce site a remarqué que l'industrie de l'annotation de données a également connu des hauts et des bas. En 2017, alors que les attentes en matière de technologie d’IA étaient en plein essor, les annotateurs de données pouvaient gagner des revenus élevés, une boîte d’extraction 2D gagnant 50 cents. Cependant, à mesure que la concurrence dans l'industrie s'intensifie et que le développement technologique ne se déroule pas sans heurts, le prix unitaire de l'annotation des données diminue de plus en plus, et désormais le plus bas n'est que de 4 cents.
Les sociétés d'annotation de données sont également confrontées à une pression énorme. Ils ont besoin d'une certaine taille et de réserves de capital pour obtenir des commandes de la source, et ils doivent faire face à des problèmes tels que des cycles de paiement longs, une rotation élevée du personnel et une qualité et un cycle instables. L'Haïtien Ruisheng est actuellement la première grande société cotée dans le secteur de l'annotation de données. Sa marge bénéficiaire l'année dernière était d'un peu plus de 10 %, et elle a enregistré des pertes au premier semestre de cette année. Les annotateurs de données craignent qu'elles ne soient bientôt remplacées par l'IA qu'ils ont contribué à créer. Certaines entreprises nationales et étrangères développent des outils capables d'étiqueter automatiquement les données, en utilisant les grands modèles courants du marché pour étiqueter les ensembles de données. Ces outils prétendent améliorer l’efficacité de l’étiquetage, réduire les coûts et atteindre une précision proche, voire supérieure, à celle du travail manuel. Bien entendu, tous les étiquetages de données ne peuvent pas être remplacés par l’IA. Certaines annotations de données qui nécessitent des connaissances professionnelles et des capacités d'analyse logique nécessitent toujours une participation manuelle, comme dans les domaines médical, financier, de la conduite autonome et autres. Mais cela signifie également que le seuil de l'industrie continuera d'augmenter. Pour les annotateurs de données, s'ils veulent survivre dans cette industrie, ils auront peut-être besoin de plus d'apprentissage et d'efforts.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!