Dans le domaine en évolution rapide de l'apprentissage automatique, un aspect est resté constant : la tâche fastidieuse et chronophage de l'étiquetage des données. Qu’ils soient utilisés pour la classification d’images, la détection d’objets ou la segmentation sémantique, les ensembles de données étiquetés par l’homme constituent depuis longtemps le fondement de l’apprentissage supervisé.
Cependant, cela pourrait bientôt changer grâce à un outil innovant appelé AutoDistill.
Le lien du code Github est le suivant : https://github.com/autodistill/autodistill?source=post_page.
AutoDistill est un projet open source révolutionnaire visant à révolutionner le processus d'apprentissage supervisé. L'outil exploite des modèles de base volumineux et plus lents pour former des modèles supervisés plus petits et plus rapides, permettant aux utilisateurs de passer directement d'images non étiquetées à des modèles personnalisés exécutés en périphérie pour l'inférence sans intervention humaine.
Le processus d'utilisation d'AutoDistill est aussi simple et puissant que sa fonctionnalité. Les données non étiquetées sont d'abord introduites dans le modèle de base. Le modèle de base utilise ensuite l'ontologie pour annoter l'ensemble de données afin d'entraîner le modèle cible. Le résultat est un modèle distillé qui effectue une tâche spécifique.
Expliquons ces composants :
La facilité d'utilisation d'AutoDistill est vraiment impressionnante : transmettez des données d'entrée non étiquetées à un modèle de base tel que Grounding DINO, puis utilisez une ontologie pour étiqueter l'ensemble de données afin d'entraîner le modèle cible, et obtenez une distillation accélérée et fine- réglage de modèles spécifiques à des tâches
Veuillez cliquer sur le lien ci-dessous pour regarder la vidéo et voir le processus en action : https://youtu.be/gKTYMfwPo4M
La vision par ordinateur a toujours eu un obstacle majeur , à savoir que l'annotation nécessite beaucoup de travail manuel. AutoDistill a franchi une étape importante vers la résolution de ce problème. Le modèle sous-jacent de l'outil, capable de créer de manière autonome des ensembles de données pour de nombreux cas d'utilisation courants, et ayant un grand potentiel d'extension de l'utilité grâce à des invites créatives et un apprentissage en quelques étapes.
Cependant, même si ces avancées sont impressionnantes, elles ne le sont pas. les données balisées ne sont plus nécessaires. À mesure que les modèles sous-jacents continuent de s’améliorer, ils seront de plus en plus capables de remplacer ou de compléter les humains dans le processus d’annotation. Mais à l’heure actuelle, l’annotation manuelle est encore nécessaire dans une certaine mesure.
Alors que les chercheurs continuent d'améliorer la précision et l'efficacité des algorithmes de détection d'objets, nous nous attendons à les voir utilisés dans un plus large éventail d'applications du monde réel. Par exemple, la détection d'objets en temps réel est un domaine de recherche clé avec de nombreuses applications dans des domaines tels que la conduite autonome, les systèmes de surveillance et l'analyse sportive.
La détection d'objets dans les vidéos est un domaine de recherche difficile qui implique le suivi d'objets sur plusieurs images et la gestion du flou de mouvement. Les développements dans ces domaines apporteront de nouvelles possibilités de détection d'objets, tout en démontrant également le potentiel d'outils tels qu'AutoDistill
AutoDistill représente un développement passionnant dans le domaine de l'apprentissage automatique. En utilisant des modèles de base pour entraîner des modèles supervisés, cet outil ouvre la voie à un avenir où la tâche fastidieuse d'annotation des données ne constituera plus un goulot d'étranglement dans le développement et le déploiement de modèles d'apprentissage automatique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!