


La dernière revue de « l'apprentissage continu » de Tsinghua, 32 pages détaillant l'examen des théories, méthodes et applications de l'apprentissage continu
D'une manière générale, l'apprentissage continu est clairement limité par des oublis catastrophiques, et l'apprentissage de nouvelles tâches entraîne souvent une forte baisse des performances sur les anciennes tâches.
En plus de cela, un nombre croissant de progrès ont été réalisés ces dernières années qui ont considérablement élargi la compréhension et l'application de l'apprentissage continu.
L'intérêt croissant et généralisé pour cette direction démontre son importance pratique et sa complexité.
Adresse papier : https://www.php.cn/link/82039d16dce0aab3913b6a7ac73deff7
Cet article fournit une introduction complète à apprentissage continu L'enquête tente d'établir des liens entre les paramètres de base, les fondements théoriques, les méthodes représentatives et les applications pratiques.
Sur la base des résultats théoriques et empiriques existants, les objectifs généraux de l'apprentissage continu sont résumés comme suit : assurer des compromis stabilité-plasticité appropriés et des capacités de généralisation intra/inter-tâches suffisantes dans le contexte de l'efficacité des ressources.
Fournit une taxonomie de pointe et détaillée qui analyse en profondeur la façon dont les stratégies représentatives abordent l'apprentissage continu et comment elles s'adaptent aux défis spécifiques dans diverses applications.
Grâce à une discussion approfondie des tendances actuelles en matière d'apprentissage continu, des perspectives transversales et des liens interdisciplinaires avec les neurosciences, nous pensons que cette perspective holistique peut grandement faciliter l'exploration ultérieure dans ce domaine et dans d'autres domaines.
Introduction
L'apprentissage est la base des systèmes intelligents pour s'adapter à l'environnement. Afin de faire face aux changements du monde extérieur, l’évolution a rendu les humains et d’autres organismes très adaptables et capables d’acquérir, de mettre à jour, d’accumuler et d’utiliser continuellement des connaissances [148], [227], [322]. Naturellement, nous nous attendons à ce que les systèmes d’intelligence artificielle (IA) s’adaptent de la même manière. Cela a inspiré des recherches sur l’apprentissage continu, où un cadre typique consiste à apprendre une séquence de contenus un par un et à se comporter comme s’ils étaient observés simultanément (Figure 1, a). Il peut s’agir de nouvelles compétences, de nouveaux exemples d’anciennes compétences, d’environnements différents, de contextes différents, etc., et contenir des défis spécifiques du monde réel [322], [413]. Étant donné que le contenu est fourni progressivement tout au long de la vie, l’apprentissage continu est également appelé apprentissage progressif ou apprentissage tout au long de la vie dans de nombreuses littératures, mais il n’existe pas de distinction stricte [70], [227].
Différent des modèles d'apprentissage automatique traditionnels basés sur la distribution de données statiques, l'apprentissage continu se caractérise par l'apprentissage à partir de la distribution dynamique de données. Un défi majeur est connu sous le nom d’oubli catastrophique [291], [292], où l’adaptation à une nouvelle distribution se traduit souvent par une capacité considérablement réduite à capturer l’ancienne distribution. Ce dilemme est l'un des aspects du compromis entre la plasticité de l'apprentissage et la stabilité de la mémoire : trop de la première interfère avec la seconde, et vice versa. Au-delà du simple équilibre entre ces deux aspects, une solution idéale pour l’apprentissage continu doit atteindre de fortes capacités de généralisation pour s’adapter aux différences de répartition au sein et entre les tâches (Figure 1, b). En tant que base de référence naïve, le recyclage de tous les anciens échantillons de formation (si cela est autorisé) peut facilement résoudre les défis ci-dessus, mais entraîne une énorme surcharge de calcul et de stockage (et des problèmes potentiels de confidentialité). En fait, l'objectif principal de l'apprentissage continu est d'assurer l'efficacité des ressources des mises à jour du modèle, de préférence proche de l'apprentissage de nouveaux échantillons de formation.
De nombreux efforts ont été consacrés à la résolution des défis ci-dessus, qui peuvent être conceptuellement divisés en cinq groupes (Figure 1, c) : Ajout de termes de régularisation en référence à l'ancien modèle (méthodes basées sur la régularisation) ; distribution de données anciennes (basée sur des méthodes de relecture) ; exploitation explicite de l'optimiseur (méthodes basées sur l'optimisation) ; apprentissage de représentations robustes et bien généralisées (méthodes basées sur la représentation) et construction de paramètres adaptatifs aux tâches à l'aide d'une architecture correctement conçue (architecture-) ; méthodes basées sur la méthode). Cette taxonomie étend les avancées récentes des taxonomies couramment utilisées et fournit des sous-directions affinées pour chaque catégorie. Il résume la manière dont ces méthodes atteignent les objectifs généraux proposés et fournit une analyse approfondie de leurs fondements théoriques et de leurs mises en œuvre typiques. En particulier, ces méthodes sont étroitement liées, telles que la régularisation et la relecture, qui corrigent finalement la direction du gradient lors de l'optimisation, et sont hautement synergiques, par exemple, l'effet de la relecture peut être amélioré en extrayant les connaissances de l'ancien modèle.
Les applications réelles posent des défis particuliers à l'apprentissage continu, qui peuvent être divisés en complexité de scène et spécificité de tâche. Pour le premier, par exemple, l'oracle de la tâche (c'est-à-dire quelle tâche effectuer) peut manquer dans la formation et les tests, et les échantillons de formation peuvent être introduits par petits lots ou même en une seule fois. En raison du coût et de la rareté de l’étiquetage des données, l’apprentissage continu doit être efficace dans des scénarios peu nombreux, semi-supervisés ou même non supervisés. Pour ces derniers, si les progrès actuels se concentrent principalement sur la classification visuelle, d'autres domaines visuels tels que la détection d'objets, la segmentation sémantique et la génération d'images, ainsi que d'autres domaines connexes tels que l'apprentissage par renforcement (RL), le traitement du langage naturel (NLP) et l'éthique considérations ) fait l'objet de plus en plus d'attention, ses opportunités et ses défis.
Compte tenu de la croissance significative de l'intérêt pour la formation continue, nous pensons que cette enquête la plus récente et complète peut fournir une perspective holistique pour les travaux ultérieurs. Bien qu'il existe quelques premières recherches sur l'apprentissage continu avec une couverture relativement large [70], [322], les progrès importants de ces dernières années n'ont pas été inclus. En revanche, les enquêtes récentes n’ont généralement rassemblé que les aspects locaux de l’apprentissage continu, en ce qui concerne ses bases biologiques [148], [156], [186], [227] et les paramètres spécialisés de classification visuelle [85], [283] , [ 289], [346], et des extensions en NLP [37], [206] ou RL [214]. À notre connaissance, il s’agit de la première enquête à résumer systématiquement les avancées récentes en matière d’apprentissage continu. En nous appuyant sur ces atouts, nous proposons une discussion approfondie sur l'apprentissage continu sur les tendances actuelles, les perspectives transversales (telles que les modèles de diffusion, la pré-formation à grande échelle, les transformateurs visuels, l'IA incarnée, la compression neuronale, etc.) et liens interdisciplinaires avec les neurosciences.
Les principales contributions comprennent :
(1) Une revue à jour et complète de l'apprentissage continu pour relier les avancées en théorie, méthodes et applications ;
(2) Basé ; sur l'actuel Certains résultats théoriques et empiriques résument les objectifs généraux de l'apprentissage continu et classent en détail les stratégies représentatives;
(3) Diviser les défis particuliers des applications réelles en complexité de scène et en tâches La particularité, et analysé en profondeur comment les stratégies d'apprentissage continu s'adaptent à ces défis
(4) Discussion approfondie des tendances actuelles de la recherche et des orientations de développement, en vue de fournir une référence pour les travaux ultérieurs dans des domaines connexes.
Cet article est organisé comme suit : Dans la section 2, nous présentons le cadre de l'apprentissage continu, y compris sa formule de base, ses scénarios typiques et ses mesures d'évaluation. Dans la section 3, nous résumons quelques efforts théoriques sur l’apprentissage continu avec leurs objectifs généraux. Dans la section 4, nous fournissons une classification à jour et détaillée des stratégies représentatives, analysant leurs motivations et leurs mises en œuvre typiques. Dans les sections 5 et 6, nous décrivons comment ces stratégies s'adaptent aux défis du monde réel liés à la complexité des scènes et à la spécificité des tâches. Dans la section 7, nous discutons des tendances actuelles, des perspectives d'orientations intersectionnelles et des liens interdisciplinaires en neurosciences.
Dans cette section, nous détaillons la classification des méthodes d'apprentissage continu représentatives (voir Figure 3 et Figure 1, c) et analysons en profondeur leurs principales motivations, leurs mises en œuvre typiques et leurs propriétés empiriques.
Méthode basée sur la régularisation
Cette direction se caractérise par l'ajout de termes de régularisation explicites pour équilibrer les tâches anciennes et nouvelles, ce qui nécessite souvent de stocker une copie figée de l'ancien modèle pour référence (voir Figure 4). Selon l’objectif de la régularisation, ces méthodes peuvent être divisées en deux catégories. Les méthodes basées sur la relecture et les méthodes qui rapprochent et restaurent les anciennes distributions de données sont regroupées dans cette direction (voir Figure 5). En fonction du contenu de la lecture, ces méthodes peuvent être divisées en trois sous-directions, chacune avec ses propres défis.
Approche basée sur l'optimisation
L'apprentissage continu peut être obtenu non seulement en ajoutant des termes supplémentaires à la fonction de perte (tels que la régularisation et la relecture), mais également en concevant et en des procédures d’optimisation opérationnelle sont mises en œuvre. Les méthodes basées sur les représentations entrent dans cette catégorie. En plus des premiers travaux sur l'obtention de représentations clairsemées grâce à la méta-formation [185], des travaux récents ont tenté de combiner l'apprentissage auto-supervisé (SSL) [125], [281], [335] et la pré-formation à grande échelle [295]. ], [380], [456] pour améliorer la représentation dans l’initialisation et l’apprentissage continu. Notez que ces deux stratégies sont étroitement liées, car les données de pré-formation sont souvent énormes et ne sont pas explicitement étiquetées, tandis que les performances de SSL lui-même sont principalement évaluées par un réglage fin (une série de) tâches en aval. Ci-dessous, nous discutons des sous-directions représentatives.
Approche basée sur l'architecture
La stratégie ci-dessus se concentre principalement sur l'apprentissage de toutes les tâches incrémentielles avec un ensemble de paramètres partagé (c'est-à-dire un modèle unique et un espace de paramètres), qui est le tâche principale, principale cause d'interférence. Au lieu de cela, la construction de paramètres spécifiques à une tâche peut résoudre explicitement ce problème. Les travaux antérieurs divisent généralement cette direction en isolation des paramètres et architecture dynamique selon que l'architecture du réseau est fixe ou non. Cet article se concentre sur les moyens d'implémenter des paramètres spécifiques à une tâche, en étendant les concepts ci-dessus à l'attribution de paramètres, à la décomposition de modèles et aux réseaux modulaires (Figure 8).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Vous avez supprimé quelque chose d'important de votre écran d'accueil et vous essayez de le récupérer ? Vous pouvez remettre les icônes d’applications à l’écran de différentes manières. Nous avons discuté de toutes les méthodes que vous pouvez suivre et remettre l'icône de l'application sur l'écran d'accueil. Comment annuler la suppression de l'écran d'accueil sur iPhone Comme nous l'avons mentionné précédemment, il existe plusieurs façons de restaurer cette modification sur iPhone. Méthode 1 – Remplacer l'icône de l'application dans la bibliothèque d'applications Vous pouvez placer une icône d'application sur votre écran d'accueil directement à partir de la bibliothèque d'applications. Étape 1 – Faites glisser votre doigt sur le côté pour trouver toutes les applications de la bibliothèque d'applications. Étape 2 – Recherchez l'icône de l'application que vous avez supprimée précédemment. Étape 3 – Faites simplement glisser l'icône de l'application de la bibliothèque principale vers le bon emplacement sur l'écran d'accueil. Voici le schéma d'application

Le rôle et l'application pratique des symboles fléchés en PHP En PHP, le symbole fléché (->) est généralement utilisé pour accéder aux propriétés et méthodes des objets. Les objets sont l'un des concepts de base de la programmation orientée objet (POO) en PHP. Dans le développement actuel, les symboles fléchés jouent un rôle important dans le fonctionnement des objets. Cet article présentera le rôle et l'application pratique des symboles fléchés et fournira des exemples de code spécifiques pour aider les lecteurs à mieux comprendre. 1. Le rôle du symbole flèche pour accéder aux propriétés d'un objet. Le symbole flèche peut être utilisé pour accéder aux propriétés d'un objet. Quand on instancie une paire

La commande Linuxtee est un outil de ligne de commande très utile qui peut écrire la sortie dans un fichier ou envoyer la sortie à une autre commande sans affecter la sortie existante. Dans cet article, nous explorerons en profondeur les différents scénarios d'application de la commande Linuxtee, du débutant au compétent. 1. Utilisation de base Tout d'abord, jetons un coup d'œil à l'utilisation de base de la commande tee. La syntaxe de la commande tee est la suivante : tee[OPTION]...[FILE]...Cette commande lira les données de l'entrée standard et enregistrera les données dans

Lors de la modification du contenu du texte dans Word, vous devez parfois saisir des symboles de formule. Certains gars ne savent pas comment saisir le numéro racine dans Word, alors Xiaomian m'a demandé de partager avec mes amis un tutoriel sur la façon de saisir le numéro racine dans Word. J'espère que cela aidera mes amis. Tout d'abord, ouvrez le logiciel Word sur votre ordinateur, puis ouvrez le fichier que vous souhaitez modifier et déplacez le curseur vers l'emplacement où vous devez insérer le signe racine, reportez-vous à l'exemple d'image ci-dessous. 2. Sélectionnez [Insérer], puis sélectionnez [Formule] dans le symbole. Comme indiqué dans le cercle rouge dans l'image ci-dessous : 3. Sélectionnez ensuite [Insérer une nouvelle formule] ci-dessous. Comme indiqué dans le cercle rouge dans l'image ci-dessous : 4. Sélectionnez [Formule radicale], puis sélectionnez le signe racine approprié. Comme le montre le cercle rouge sur l'image ci-dessous :

Le langage Go est un langage de programmation open source développé par Google et lancé pour la première fois en 2007. Il est conçu pour être un langage simple, facile à apprendre, efficace et hautement simultané, et est favorisé par de plus en plus de développeurs. Cet article explorera les avantages du langage Go, présentera quelques scénarios d'application adaptés au langage Go et donnera des exemples de code spécifiques. Avantages : Forte concurrence : le langage Go prend en charge de manière intégrée les threads-goroutine légers, qui peuvent facilement implémenter une programmation simultanée. Goroutin peut être démarré en utilisant le mot-clé go

Titre : Apprenez la fonction principale du langage Go à partir de zéro. En tant que langage de programmation simple et efficace, le langage Go est privilégié par les développeurs. Dans le langage Go, la fonction principale est une fonction d'entrée, et chaque programme Go doit contenir la fonction principale comme point d'entrée du programme. Cet article explique comment apprendre la fonction principale du langage Go à partir de zéro et fournit des exemples de code spécifiques. 1. Tout d’abord, nous devons installer l’environnement de développement du langage Go. Vous pouvez aller sur le site officiel (https://golang.org

La large application de Linux dans le domaine du cloud computing Avec le développement et la vulgarisation continus de la technologie du cloud computing, Linux, en tant que système d'exploitation open source, joue un rôle important dans le domaine du cloud computing. En raison de leur stabilité, de leur sécurité et de leur flexibilité, les systèmes Linux sont largement utilisés dans diverses plates-formes et services de cloud computing, fournissant une base solide pour le développement de la technologie du cloud computing. Cet article présentera le large éventail d'applications de Linux dans le domaine du cloud computing et donnera des exemples de code spécifiques. 1. Technologie de virtualisation d'applications de Linux dans la plate-forme de cloud computing Technologie de virtualisation

L'horodatage MySQL est un type de données très important, qui peut stocker la date, l'heure ou la date plus l'heure. Dans le processus de développement actuel, l'utilisation rationnelle des horodatages peut améliorer l'efficacité des opérations de base de données et faciliter les requêtes et les calculs liés au temps. Cet article abordera les fonctions, les fonctionnalités et les scénarios d'application des horodatages MySQL, et les expliquera avec des exemples de code spécifiques. 1. Fonctions et caractéristiques des horodatages MySQL Il existe deux types d'horodatages dans MySQL, l'un est TIMESTAMP
