Le 4 septembre, Meta a récemment publié un ensemble de données open source appelé FACET, conçu pour aider les chercheurs à auditer les biais dans les modèles de vision par ordinateur.
Dans un article de blog, Meta a expliqué qu'il est difficile d'évaluer l'équité de l'IA à l'aide des méthodes d'analyse comparative actuelles. Selon Meta, FACET simplifiera cette tâche en fournissant un vaste ensemble de données d'évaluation que les chercheurs pourront utiliser pour auditer plusieurs types différents de modèles de vision par ordinateur.
Les méta-chercheurs détaillent dans un article de blog : « L'ensemble de données se compose de 32 000 images de 50 000 personnes, étiquetées par des annotateurs humains experts avec des attributs démographiques tels que la présentation du sexe perçu, le groupe d'âge perçu, des attributs physiques supplémentaires tels que la couleur de la peau perçue, la coiffure, et les catégories liées aux personnes telles que les joueurs de basket-ball, les médecins, etc. FACET contient également des étiquettes de personnes, de cheveux et de vêtements pour 69 000 masques dans SA-1B. Les modèles de vision par ordinateur traitent les photos dans FACET pour vérifier les problèmes d'équité. À partir de là, ils peuvent effectuer une analyse pour déterminer si la précision des résultats du modèle varie d'une photo à l'autre. Cette variation de précision pourrait être le signe que l’IA est biaisée.
Les chercheurs peuvent utiliser cet ensemble de données pour détecter les biais dans les réseaux neuronaux optimisés pour la classification, la tâche consistant à regrouper des images similaires. De plus, cela facilite l’évaluation des modèles de détection d’objets. Ce modèle est conçu pour détecter automatiquement les éléments d’intérêt dans les photos.
FACET peut également auditer les applications d'IA qui effectuent la segmentation des instances et la mise à la terre visuelle, deux tâches spécialisées de détection d'objets. La segmentation d'instance est le processus de mise en évidence d'éléments d'intérêt dans une photo, par exemple en dessinant un cadre autour d'eux. Le modèle de base de vision, quant à lui, est un réseau neuronal qui analyse les photos à la recherche d'objets que les utilisateurs décrivent en langage naturel.
Les chercheurs de Meta ont déclaré : « Bien que FACET soit uniquement destiné à des fins d'évaluation de la recherche et ne puisse pas être utilisé à des fins de formation, notre objectif en publiant l'ensemble de données et le navigateur d'ensembles de données est que FACET puisse devenir une référence standard d'évaluation de l'équité pour les modèles de vision par ordinateur »
.Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!