Frank Hutter, directeur du laboratoire d'apprentissage automatique de l'université de Fribourg en Allemagne, a déclaré que le résultat de toutes ces décisions humaines est que les modèles complexes finissent par être « conçus de manière intuitive » plutôt que systématiquement.
Un domaine en pleine croissance appelé apprentissage automatique (autoML) vise à éliminer ces incertitudes. L’idée est de laisser les algorithmes prendre le relais des décisions que les chercheurs doivent actuellement prendre lors de la conception des modèles. À terme, ces technologies pourraient rendre l’apprentissage automatique plus accessible.
Bien que l'apprentissage automatique automatique existe depuis près d'une décennie, les chercheurs travaillent toujours à l'améliorer. Une nouvelle conférence qui se déroule aujourd'hui à Baltimore présente les efforts visant à améliorer la précision et à rationaliser les performances d'autoML.
Le potentiel d’autoML pour simplifier l’apprentissage automatique suscite un vif intérêt. Des entreprises comme Amazon et Google proposent déjà des outils d'apprentissage automatique low-code qui exploitent la technologie autoML. Si ces techniques deviennent plus efficaces, elles pourraient accélérer la recherche et rendre l’apprentissage automatique accessible à un plus grand nombre de personnes.
L'idée est de permettre aux gens de choisir la question qu'ils souhaitent poser, de pointer l'outil autoML dessus et d'obtenir les résultats qu'ils souhaitent.
Cette vision est le "Saint Graal de l'informatique", a déclaré Lars Kotthoff, professeur adjoint d'informatique à l'Université du Wyoming et organisateur de la conférence "Vous spécifiez le problème, l'ordinateur sait comment le résoudre, et c'est tout vous. " Mais d'abord, les chercheurs doivent trouver comment rendre ces techniques plus efficaces en termes de temps et d'énergie.
À première vue, le concept d'autoML peut sembler redondant : après tout, l'apprentissage automatique consiste déjà à automatiser le processus d'extraction d'informations à partir des données. Mais comme les algorithmes AutoML fonctionnent à un niveau d’abstraction supérieur aux modèles d’apprentissage automatique sous-jacents, en s’appuyant uniquement sur les résultats de ces modèles à titre indicatif, ils permettent d’économiser du temps et des efforts de calcul.
Les chercheurs peuvent appliquer la technologie autoML à des modèles pré-entraînés pour obtenir de nouvelles informations sans gaspiller de puissance de calcul en dupliquant des recherches existantes.
Par exemple, Mehdi Bahrami, chercheur au Fujitsu Research Institute aux États-Unis, et ses co-auteurs ont présenté des travaux récents sur la façon d'utiliser l'algorithme de tri BERT avec différents modèles pré-entraînés pour s'adapter à de nouveaux objectifs.
BERT-sort est un algorithme qui trouve ce qu'on appelle « l'ordre sémantique » lors de l'entraînement sur un ensemble de données. Par exemple, à partir des données des critiques de films, il sait que les « bons » films sont mieux classés que les « bons » et les « mauvais » films.
Grâce à la technologie autoML, l'ordre sémantique appris peut également être généralisé pour classer les diagnostics de cancer et même les textes en langue étrangère, réduisant ainsi le temps et les calculs.
"BERT nécessite des mois de calcul et coûte très cher, comme 1 million de dollars pour générer le modèle et répéter le processus." Bahrami a déclaré : "Donc, si tout le monde veut faire la même chose, cela coûte cher - ce n'est pas économe en énergie et c'est mauvais." pour la durabilité du monde. "
Malgré les promesses montrées dans ce domaine, les chercheurs recherchent toujours des moyens de rendre la technologie autoML plus efficace sur le plan informatique. Par exemple, avec des méthodes telles que Neural Architecture Search (NAS), dans lesquelles de nombreux modèles différents sont construits et testés pour trouver le meilleur ajustement, l'énergie requise pour réaliser toutes ces itérations peut être importante.
L'apprentissage automatique peut également être appliqué aux algorithmes d'apprentissage automatique qui n'impliquent pas de réseaux de neurones, comme la création de forêts de décisions aléatoires ou la prise en charge de machines vectorielles pour classer les données. Les recherches dans ces domaines sont en cours et il existe déjà de nombreuses bibliothèques de codage disponibles pour les personnes souhaitant intégrer la technologie autoML dans leurs projets.
Hutter a déclaré que la prochaine étape consiste à utiliser autoML pour quantifier l'incertitude et résoudre les problèmes de crédibilité et d'équité dans l'algorithme. Dans cette vision, les critères de fiabilité et d’équité seraient similaires à toute autre contrainte d’apprentissage automatique, telle que l’exactitude. AutoML peut capturer et corriger automatiquement les biais trouvés dans ces algorithmes avant leur publication.
Mais pour des applications comme l'apprentissage profond, autoML a encore un long chemin à parcourir. Les données utilisées pour entraîner les modèles d'apprentissage profond, telles que les images, les documents et les paroles enregistrées, sont souvent denses et complexes. Son traitement nécessite une énorme puissance de calcul. Le coût et le temps nécessaires à la formation de ces modèles peuvent être prohibitifs pour quiconque, à l'exception des chercheurs travaillant dans de grandes entreprises aux poches bien garnies.
L'une des exigences du concours lors de la conférence est que les participants développent des algorithmes alternatifs économes en énergie pour la recherche d'architecture neuronale. C’est tout un défi car cette technologie est connue pour ses exigences informatiques. Il parcourt automatiquement d'innombrables modèles d'apprentissage profond pour aider les chercheurs à choisir celui qui convient à leur application, mais le processus peut prendre des mois et coûter plus d'un million de dollars.
L'objectif de ces algorithmes alternatifs, appelés agents de recherche d'architecture neuronale à coût nul, est de rendre la recherche d'architecture neuronale plus accessible et plus écologique en réduisant considérablement ses exigences de calcul. Les résultats ne prennent que quelques secondes, et non des mois. Pour l’instant, ces techniques en sont encore aux premiers stades de développement et sont souvent peu fiables, mais les chercheurs en apprentissage automatique prédisent qu’elles ont le potentiel de rendre le processus de sélection de modèles plus efficace.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!