IT House News du 9 octobre, les grands modèles d'IA ont été un sujet brûlant dans le domaine de l'intelligence artificielle ces dernières années. Ils peuvent réaliser diverses fonctions étonnantes, telles que générer du texte et des images réalistes, ou avoir des conversations fluides avec des humains. Mais derrière ces grands modèles se cache un groupe d’annotateurs de données inconnus qui travaillent dur chaque jour pour ajouter des étiquettes aux données brutes et fournir à la technologie de l’IA les données massives nécessaires à la formation.
Source de l'image Pixabay
Le travail des annotateurs de données n'est pas facile. Ils doivent faire face à des tâches fastidieuses, à de faibles revenus, à une instabilité à long terme et au risque d'être remplacés à tout moment. Ils sont la pierre angulaire du développement de la technologie de l’intelligence artificielle, mais ils reçoivent peu d’attention et de respect
Selon un rapport de « Tech Planet », les annotateurs de données utilisent le système de rémunération à la pièce le plus primitif pour calculer les salaires, et la plupart des praticiens ne gagnent pas plus de 5 000 yuans par mois. Certaines d’entre elles sont diplômées d’université, d’autres sont mères et d’autres encore ont changé de carrière. Ils traitent des images, des textes, des voix et d'autres données dans de petites cellules situées dans des villes de troisième et quatrième rang, fournissant ainsi des services aux géants de l'Internet et aux constructeurs automobiles
IT House a remarqué que le secteur de l'annotation de données a également connu des hauts et des bas. En 2017, alors que les attentes en matière de technologie d’IA étaient en plein essor, les annotateurs de données pouvaient gagner des revenus élevés, une boîte d’extraction 2D gagnant 50 cents. Cependant, à mesure que la concurrence dans le secteur s'intensifie et que le développement technologique échoue, le prix unitaire de l'annotation des données diminue de plus en plus, pour atteindre désormais 4 cents.
Le secteur de l'annotation de données est confronté à une pression énorme. L'entreprise doit disposer d'une certaine taille et de réserves de capital pour obtenir des commandes et faire face à des problèmes tels qu'un long cycle de paiement, une rotation élevée du personnel et une qualité et un cycle instables. L'Haïtien Ruisheng est la première entreprise du secteur à être cotée au tableau principal. La marge bénéficiaire de l'année dernière était d'un peu plus de 10 %, mais elle a enregistré des pertes au premier semestre de cette année
.Les annotateurs de données craignent de plus en plus qu’elles soient bientôt remplacées par une intelligence artificielle qu’ils ont eux-mêmes contribué à créer. Certaines entreprises nationales et étrangères développent des outils capables d'étiqueter automatiquement les données, en utilisant les grands modèles courants du marché pour étiqueter les ensembles de données. Ces outils prétendent améliorer l'efficacité des annotations, réduire les coûts et atteindre des taux de précision proches, voire supérieurs à ceux du travail manuel
Bien sûr, toutes les annotations de données ne peuvent pas être remplacées par l'IA. Certaines annotations de données qui nécessitent des connaissances professionnelles et des capacités d'analyse logique nécessitent toujours une participation manuelle, comme dans les domaines médical, financier, de la conduite autonome et autres. Mais cela signifie également que le seuil de l'industrie continuera d'augmenter. Pour les annotateurs de données, s'ils veulent survivre dans cette industrie, ils auront peut-être besoin de plus d'apprentissage et d'efforts.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!