Maison Tutoriel matériel Examen du matériel Tsinghua Optics AI apparaît dans Nature ! Réseau neuronal physique, la rétropropagation n'est plus nécessaire

Tsinghua Optics AI apparaît dans Nature ! Réseau neuronal physique, la rétropropagation n'est plus nécessaire

Aug 10, 2024 pm 10:15 PM
神经网络 物理 光学 清华 传播 besoin inverse

Utiliser la lumière pour entraîner les réseaux de neurones, les résultats de l’Université Tsinghua ont été récemment publiés dans Nature !

Que dois-je faire si l'algorithme de rétropropagation ne peut pas être appliqué ?

Ils ont proposé une méthode de formation en mode entièrement avancé (FFM), qui effectue directement le processus de formation dans le système optique physique, surmontant ainsi les limites des simulations informatiques numériques traditionnelles.

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

Pour faire simple, il fallait autrefois modéliser le système physique en détail puis simuler ces modèles sur ordinateur pour entraîner le réseau. La méthode FFM élimine le processus de modélisation et permet au système d'utiliser directement les données expérimentales pour l'apprentissage et l'optimisation.

Cela signifie également que la formation n'a plus besoin de vérifier chaque couche d'arrière en avant (rétropropagation), mais peut directement mettre à jour les paramètres du réseau d'avant en arrière.

Par exemple, tout comme un puzzle, la rétropropagation doit d'abord voir l'image finale (sortie), puis la vérifier et la restaurer pièce par pièce à l'envers, tandis que la méthode FFM ressemble plus à un puzzle partiellement terminé en main, et seulement ; doit suivre quelques principes légers (réciprocité symétrique) Continuez à remplir sans revenir en arrière pour vérifier les pièces du puzzle précédentes.

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

De cette façon, les avantages de l'utilisation de FFM sont également évidents :

Premièrement, cela réduit la dépendance aux modèles mathématiques, ce qui peut éviter les problèmes causés par des modèles inexacts. Deuxièmement, cela permet de gagner du temps (et consomme moins d'énergie) ; L'utilisation de systèmes optiques permet de traiter en parallèle de grandes quantités de données et d'opérations, et l'élimination de la rétropropagation réduit également le nombre d'étapes à travers le réseau qui doivent être vérifiées et ajustées.

Les co-auteurs de l'article sont Xue Zhiwei et Zhou Tiankui de l'Université Tsinghua, et les auteurs correspondants sont le professeur Fang Lu et l'académicien Dai Qionghai de l'Université Tsinghua. De plus, Xu Zhihao du Département d'électronique de l'Université Tsinghua et Yu Shaoliang du laboratoire Zhijiang ont également participé à cette recherche.

Éliminer la rétropropagation

Résumé du principe FFM en une phrase :

Mappez le système optique dans un réseau neuronal paramétré sur site, calculez le gradient en mesurant le champ lumineux de sortie et mettez à jour les paramètres à l'aide de l'algorithme de descente de gradient.

En termes simples, cela signifie laisser le système optique s'auto-apprendre, comprendre ses propres performances en observant comment il traite la lumière (c'est-à-dire en mesurant le champ lumineux de sortie), puis utiliser ces informations pour ajuster progressivement ses réglages (paramètres).

La figure suivante montre le mécanisme de fonctionnement du FFM dans un système optique :

où a est la limitation de la méthode de conception traditionnelle ; b est la composition du système optique ; c est la cartographie du système optique avec le réseau neuronal ; .

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

En expansion, le système optique général (b), comprenant l'optique de lentille en espace libre et la photonique intégrée, se compose d'une région de modulation (vert foncé) et d'une région de propagation (vert clair). Dans ces régions, l'indice de réfraction de la région de modulation est réglable, tandis que l'indice de réfraction de la région de propagation est fixe.

Et les zones de modulation et de propagation ici peuvent être mappées aux poids et aux connexions neuronales du réseau neuronal.

Dans un réseau neuronal, ces parties réglables sont comme des points de connexion entre les neurones et peuvent changer leur force (poids) pour apprendre.

En utilisant le principe de réciprocité de symétrie spatiale, les données et le calcul des erreurs peuvent partager le même processus de propagation physique vers l'avant et la même méthode de mesure.

C'est un peu comme un reflet dans un miroir, chaque partie du système répond de la même manière à la propagation de la lumière et aux retours d'erreur. Cela signifie que quelle que soit la manière dont la lumière pénètre dans le système, celui-ci la traite de manière cohérente et s'ajuste en fonction des résultats.

De cette manière, le gradient peut être calculé directement sur site et utilisé pour mettre à jour l'indice de réfraction dans la zone de conception, optimisant ainsi les performances du système.

Grâce à la méthode de descente de gradient sur site, le système optique peut ajuster progressivement ses paramètres jusqu'à ce qu'il atteigne l'état optimal.

Le texte original utilise l'équation pour finalement exprimer la méthode de descente de gradient en mode avant complet mentionnée ci-dessus (remplaçant la rétropropagation) comme :

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

Une méthode de formation de réseau de neurones optiques

En tant que méthode de formation de réseau de neurones optiques, FFM It présente les avantages suivants :

Précision comparable au modèle idéal

L'utilisation de FFM peut réaliser un processus d'auto-formation efficace sur le réseau neuronal optique en espace libre (Optical Neural Network, ONN).

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

Pour illustrer cette conclusion, les chercheurs ont d'abord utilisé un ONN monocouche pour effectuer un entraînement à la classification d'objets sur l'ensemble de données de référence (a).

Plus précisément, ils ont utilisé quelques images de chiffres manuscrits (ensemble de données MNIST) pour entraîner ce système, puis ont visualisé les résultats (b).

Les résultats montrent que l'ONN formé par l'apprentissage FFM présente une similitude extrêmement élevée entre le champ lumineux expérimental et le champ lumineux théorique (SSIM dépasse 0,97).

En d’autres termes, il apprend si bien qu’il peut presque parfaitement copier les exemples qui lui sont donnés.

Cependant, les chercheurs rappellent également :

En raison des imperfections du système, les champs lumineux et les gradients théoriquement calculés ne peuvent pas refléter avec précision les phénomènes physiques réels.

Ensuite, les chercheurs ont utilisé des images plus complexes (ensemble de données Fashion-MNIST) pour entraîner le système à reconnaître différents articles de mode.

Au début, lorsque le nombre de couches passait de 2 à 8, la précision moyenne du réseau formé par ordinateur était presque la moitié de la précision théorique.

Grâce à la méthode d'apprentissage FFM, la précision du réseau du système a été augmentée à 92,5%, ce qui est proche de la valeur théorique.

Cela montre qu'à mesure que le nombre de couches réseau augmente, les performances du réseau formé par les méthodes traditionnelles diminuent, tandis que l'apprentissage FFM peut maintenir une grande précision.

Dans le même temps, les performances d'ONN peuvent être encore améliorées en intégrant l'activation non linéaire dans l'apprentissage FFM. Lors d'expériences, l'apprentissage FFM non linéaire a permis d'améliorer la précision de la classification de 90,4 % à 93,0 %.

La recherche prouve en outre qu'en entraînant des ONN non linéaires par lots, le processus de propagation des erreurs peut être simplifié et le temps d'entraînement n'augmente que de 1 à 1,7 fois.

Capacité de mise au point haute résolution

FFM peut également obtenir une imagerie de haute qualité dans des applications pratiques, atteignant une résolution proche de la limite physique, même dans des environnements de diffusion complexes.

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

Tout d'abord, lorsque les ondes lumineuses pénètrent dans un milieu diffusant (comme le brouillard, la fumée ou les tissus biologiques, etc.), la focalisation va devenir compliquée, mais la propagation des ondes lumineuses dans le milieu conserve souvent une certaine symétrie.

FFM profite de cette symétrie en optimisant le chemin de propagation et la phase des ondes lumineuses pour réduire l'impact négatif des effets de diffusion sur la focalisation.

L'effet est également très significatif. La figure b montre la comparaison des deux méthodes d'optimisation, FFM et PSO (Particle Swarm Optimization).

Plus précisément, l'expérience a utilisé deux supports de diffusion, l'un est une plaque à phase aléatoire (Scatterer-I) et l'autre est un ruban transparent (Scatterer-II).

Dans les deux médias, FFM a atteint la convergence (trouver plus rapidement la solution optimale) après seulement 25 itérations de conception, avec des valeurs de perte de convergence de 1,84 et 2,07 respectivement (plus les performances sont faibles).

La méthode PSO nécessite au moins 400 itérations de conception pour atteindre la convergence, et les valeurs de perte à la convergence finale sont de 2,01 et 2,15.

Dans le même temps, la figure c montre que FFM est capable de s'optimiser en permanence et que son orientation est conçue pour évoluer progressivement et converger d'une distribution aléatoire initiale vers une orientation étroite.

Dans une zone de conception de 3,2 mm × 3,2 mm, les chercheurs ont en outre échantillonné uniformément les foyers optimisés FFM et PSO et comparé leur FWHM (pleine largeur à mi-hauteur) et PSNR (rapport signal/bruit de pointe).

Les résultats montrent que FFM a une précision de mise au point plus élevée et une meilleure qualité d'imagerie.

La figure e évalue en outre les performances du réseau de focalisation conçu lors de la numérisation d'une carte de résolution située derrière un milieu de diffusion.

Les résultats sont surprenants. La taille du foyer de la conception FFM est proche de la limite de diffraction de 64,5 m, qui est la norme théorique de résolution la plus élevée pour l'imagerie optique.

Capable d'imager en parallèle des objets en dehors de la ligne de mire

Comme il est si puissant dans les médias de diffusion, les chercheurs ont également essayé des scénarios sans ligne de mire (NLOS), dans lesquels les objets sont cachés à la vue.

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

FFM exploite la symétrie spatiale du trajet lumineux de l'objet caché à l'observateur, ce qui permet au système de reconstruire et d'analyser les objets cachés dynamiques sur le terrain de manière entièrement optique.

En concevant le front d'onde d'entrée, FFM est capable de projeter simultanément tous les maillages de l'objet vers leurs positions cibles, réalisant ainsi une récupération parallèle des objets cachés.

Les cibles de chrome cachées en forme de lettre "T", "H" et "U" ont été utilisées dans l'expérience, et le temps d'exposition (1 milliseconde) et la puissance optique (0,20 mW) ont été réglés pour obtenir une imagerie rapide de ces dynamiques. cibles.

Les résultats montrent que sans le front d'onde conçu par FFM, l'image sera gravement déformée. Alors que le front d'onde conçu par FFM a pu récupérer les formes des trois lettres, le SSIM (indice de similarité structurelle) a atteint 1,0, indiquant un degré élevé de similitude avec l'image originale.

De plus, comparé au réseau neuronal artificiel (ANN) en termes d'efficacité des photons et de performances de classification, le FFM surpasse considérablement l'ANN, en particulier dans des conditions de faibles photons.

Plus précisément, dans les situations où le nombre de photons est limité (comme de nombreuses surfaces réfléchissantes ou très diffuses), FFM est capable de corriger de manière adaptative la distorsion du front d'onde et nécessite moins de photons pour une classification précise.

Recherche automatique de valeurs aberrantes dans les systèmes non hermitiens

La méthode FFM convient non seulement aux systèmes optiques en espace libre, mais peut également être étendue à l'auto-conception de systèmes photoniques intégrés.

 清华光学 AI 登 Nature!物理神经网络,反向传播不需要了

Les chercheurs ont construit un réseau neuronal intégré (a) utilisant des noyaux photoniques symétriques configurés en série et en parallèle.

Dans l'expérience, le noyau symétrique a été configuré avec un atténuateur optique variable (VOA) via différents niveaux de courant d'injection pour obtenir différents coefficients d'atténuation afin de simuler différents poids.

Dalam Rajah c, ketepatan nilai matriks yang diprogramkan dalam teras simetri adalah sangat tinggi, dengan sisihan piawai hanyut masa masing-masing 0.012%, 0.012% dan 0.010%, menunjukkan bahawa nilai matriks sangat stabil.

Dan, para penyelidik memvisualisasikan ralat untuk setiap lapisan. Membandingkan kecerunan eksperimen dengan nilai simulasi teori, sisihan purata ialah 3.5%.

Selepas kira-kira 100 lelaran (zaman), rangkaian mencapai penumpuan.

Hasil eksperimen menunjukkan bahawa di bawah tiga konfigurasi nisbah simetri yang berbeza (1.0, 0.75 atau 0.5), ketepatan pengelasan rangkaian ialah 94.7%, 89.2% dan 89.0% masing-masing.

Ketepatan klasifikasi yang diperoleh dengan menggunakan rangkaian neural menggunakan kaedah FFM ialah 94.2%, 89.2% dan 88.7%.

Sebaliknya, jika kaedah simulasi komputer tradisional digunakan untuk mereka bentuk rangkaian, ketepatan pengelasan eksperimen akan menjadi lebih rendah, masing-masing 71.7%, 65.8% dan 55.0%.

Akhirnya, para penyelidik juga menunjukkan bahawa FFM boleh mereka bentuk sendiri sistem bukan Hermitian dan mencapai lintasan titik tunggal tanpa memerlukan model fizikal melalui simulasi berangka.

Sistem bukan Hermitian ialah konsep dalam fizik, yang melibatkan sistem dalam bidang seperti mekanik kuantum dan optik, yang tidak memenuhi syarat Hermitian.

Sifat Hermitian adalah berkaitan dengan simetri sistem dan bilangan sebenar sistem bukan Hermitian Mereka mungkin mempunyai beberapa fenomena fizikal yang istimewa, seperti titik luar biasa (Exceptional Points), yang merupakan dinamik. di mana tingkah laku pembelajaran mengalami perubahan aneh pada titik tertentu.

Untuk meringkaskan artikel penuh, FFM ialah kaedah untuk melaksanakan proses latihan intensif secara pengiraan pada sistem fizikal, yang mampu melaksanakan kebanyakan operasi pembelajaran mesin secara selari dengan cekap.

Untuk tetapan percubaan yang lebih terperinci dan proses penyediaan set data, sila rujuk artikel asal.

Kod:

https://zenodo.org/records/10820584

Teks asal "Nature":

https://www.nature.com/articles/s41586-024-07687-4

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

<🎜>: Grow A Garden - Guide de mutation complet
3 Il y a quelques semaines By DDD
<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Système de fusion, expliqué
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Tutoriel Java
1667
14
Tutoriel PHP
1273
29
Tutoriel C#
1255
24
YOLO est immortel ! YOLOv9 est sorti : performances et vitesse SOTA~ YOLO est immortel ! YOLOv9 est sorti : performances et vitesse SOTA~ Feb 26, 2024 am 11:31 AM

Les méthodes d'apprentissage profond d'aujourd'hui se concentrent sur la conception de la fonction objectif la plus appropriée afin que les résultats de prédiction du modèle soient les plus proches de la situation réelle. Dans le même temps, une architecture adaptée doit être conçue pour obtenir suffisamment d’informations pour la prédiction. Les méthodes existantes ignorent le fait que lorsque les données d’entrée subissent une extraction de caractéristiques couche par couche et une transformation spatiale, une grande quantité d’informations sera perdue. Cet article abordera des problèmes importants lors de la transmission de données via des réseaux profonds, à savoir les goulots d'étranglement de l'information et les fonctions réversibles. Sur cette base, le concept d'information de gradient programmable (PGI) est proposé pour faire face aux différents changements requis par les réseaux profonds pour atteindre des objectifs multiples. PGI peut fournir des informations d'entrée complètes pour la tâche cible afin de calculer la fonction objectif, obtenant ainsi des informations de gradient fiables pour mettre à jour les pondérations du réseau. De plus, un nouveau cadre de réseau léger est conçu

Guide de réglage de la mise au point de l'appareil photo iPhone 15 Pro Guide de réglage de la mise au point de l'appareil photo iPhone 15 Pro Sep 23, 2023 am 10:29 AM

Sur les modèles iPhone 15 Pro d'Apple, l'appareil photo principal permet désormais aux utilisateurs de basculer entre trois focales pendant la prise de vue. Lisez la suite pour savoir comment cela fonctionne. Pour profiter pleinement du système de caméra amélioré sur l’iPhone 15 Pro et l’iPhone 15 Pro Max, Apple a ajouté trois options de focale populaires au zoom optique de la caméra principale. Il existe par défaut 24 mm (équivalent au zoom optique 1x), 28 mm (zoom optique 1,2x) et 35 mm (zoom optique 1,5x). Apple met ces distances focales spécifiques à la disposition des passionnés de photographie en utilisant un traitement informatique pour recadrer les images de 48 mégapixels que le nouveau capteur plus grand peut capturer, de sorte que le résultat est toujours une image haute résolution de 24 MP. toi

'Le propriétaire de Bilibili UP a créé avec succès le premier réseau neuronal au monde basé sur la pierre rouge, qui a fait sensation sur les réseaux sociaux et a été salué par Yann LeCun.' 'Le propriétaire de Bilibili UP a créé avec succès le premier réseau neuronal au monde basé sur la pierre rouge, qui a fait sensation sur les réseaux sociaux et a été salué par Yann LeCun.' May 07, 2023 pm 10:58 PM

Dans Minecraft, la redstone est un élément très important. C'est un matériau unique dans le jeu. Les interrupteurs, les torches de redstone et les blocs de redstone peuvent fournir une énergie semblable à l'électricité aux fils ou aux objets. Les circuits Redstone peuvent être utilisés pour construire des structures permettant de contrôler ou d'activer d'autres machines. Ils peuvent eux-mêmes être conçus pour répondre à une activation manuelle par les joueurs, ou ils peuvent émettre des signaux à plusieurs reprises ou répondre à des changements provoqués par des non-joueurs, tels que le mouvement des créatures. et des objets. Chute, croissance des plantes, jour et nuit, et plus encore. Par conséquent, dans mon monde, Redstone peut contrôler de nombreux types de machines, allant des machines simples telles que les portes automatiques, les interrupteurs d'éclairage et les alimentations stroboscopiques, aux énormes ascenseurs, aux fermes automatiques, aux petites plates-formes de jeu et même aux machines intégrées aux jeux. Récemment, la station B UP principale @

Comment activer et désactiver les préréglages de mise au point de la caméra sur iPhone 15 Pro Comment activer et désactiver les préréglages de mise au point de la caméra sur iPhone 15 Pro Sep 23, 2023 pm 05:25 PM

Sur les modèles iPhone 15 Pro d'Apple, les utilisateurs peuvent basculer entre trois focales prédéfinies de l'appareil photo lors de la prise de vue avec l'appareil photo principal. Cet article explique ce qu'ils sont et comment les activer ou les désactiver sur votre iPhone. Pour profiter pleinement du système de caméra amélioré sur l’iPhone 15 Pro et l’iPhone 15 Pro Max, Apple a ajouté trois options de focale populaires au zoom optique de la caméra principale. Il existe par défaut 24 mm (équivalent au zoom optique 1x), 28 mm (zoom optique 1,2x) et 35 mm (zoom optique 1,5x). Apple met ces distances focales spécifiques à la disposition des passionnés de photographie en utilisant un traitement informatique pour convertir les images de 48 mégapixels que le nouveau capteur plus grand peut capturer,

Le guide parfait de Tsinghua Mirror Source : rendez l'installation de votre logiciel plus fluide Le guide parfait de Tsinghua Mirror Source : rendez l'installation de votre logiciel plus fluide Jan 16, 2024 am 10:08 AM

Guide d'utilisation de la source d'images Tsinghua : pour rendre l'installation de votre logiciel plus fluide, des exemples de code spécifiques sont nécessaires dans le processus d'utilisation quotidienne des ordinateurs, nous devons souvent installer divers logiciels pour répondre à différents besoins. Cependant, lors de l'installation de logiciels, nous rencontrons souvent des problèmes tels qu'une vitesse de téléchargement lente et une impossibilité de se connecter, en particulier lors de l'utilisation de sources miroir étrangères. Afin de résoudre ce problème, l'Université Tsinghua fournit une source miroir, qui fournit de riches ressources logicielles et a une vitesse de téléchargement très rapide. Voyons ensuite la stratégie d'utilisation de la source miroir Tsinghua. d'abord,

Comment convertir une machine virtuelle en machine physique ? Comment convertir une machine virtuelle en machine physique ? Feb 19, 2024 am 11:40 AM

La conversion d'une machine virtuelle (VM) en machine physique est le processus de migration des instances virtuelles et des logiciels d'application associés vers une plate-forme matérielle physique. Cette conversion permet d'optimiser les performances du système d'exploitation et l'utilisation des ressources matérielles. Cet article vise à fournir un aperçu approfondi de la façon d’effectuer cette conversion. Comment mettre en œuvre la migration d’une machine virtuelle vers une machine physique ? Généralement, le processus de conversion entre une machine virtuelle et une machine physique est effectué en dehors de la machine virtuelle par un logiciel tiers. Ce processus comprend plusieurs étapes impliquant la configuration des machines virtuelles et le transfert de ressources. Préparez la machine physique : la première étape consiste à vous assurer que la machine physique répond à la configuration matérielle requise pour Windows. Nous devons sauvegarder les données sur une machine physique car le processus de conversion écrasera les données existantes. *Nom d'utilisateur et mot de passe pour un compte administrateur avec des droits d'administrateur pour créer des images système. sera virtuel

1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT 1,3 ms prend 1,3 ms ! La dernière architecture de réseau neuronal mobile open source de Tsinghua, RepViT Mar 11, 2024 pm 12:07 PM

Adresse papier : https://arxiv.org/abs/2307.09283 Adresse code : https://github.com/THU-MIG/RepViTRepViT fonctionne bien dans l'architecture ViT mobile et présente des avantages significatifs. Ensuite, nous explorons les contributions de cette étude. Il est mentionné dans l'article que les ViT légers fonctionnent généralement mieux que les CNN légers sur les tâches visuelles, principalement en raison de leur module d'auto-attention multi-têtes (MSHA) qui permet au modèle d'apprendre des représentations globales. Cependant, les différences architecturales entre les ViT légers et les CNN légers n'ont pas été entièrement étudiées. Dans cette étude, les auteurs ont intégré des ViT légers dans le système efficace.

Multi-chemin, multi-domaine, tout compris ! Google AI publie le modèle général d'apprentissage multi-domaines MDL Multi-chemin, multi-domaine, tout compris ! Google AI publie le modèle général d'apprentissage multi-domaines MDL May 28, 2023 pm 02:12 PM

Les modèles d'apprentissage profond pour les tâches de vision (telles que la classification d'images) sont généralement formés de bout en bout avec des données provenant d'un seul domaine visuel (telles que des images naturelles ou des images générées par ordinateur). Généralement, une application qui effectue des tâches de vision pour plusieurs domaines doit créer plusieurs modèles pour chaque domaine distinct et les former indépendamment. Les données ne sont pas partagées entre différents domaines. Lors de l'inférence, chaque modèle gérera un domaine spécifique. Même s'ils sont orientés vers des domaines différents, certaines caractéristiques des premières couches entre ces modèles sont similaires, de sorte que la formation conjointe de ces modèles est plus efficace. Cela réduit la latence et la consommation d'énergie, ainsi que le coût de la mémoire lié au stockage de chaque paramètre du modèle. Cette approche est appelée apprentissage multidomaine (MDL). De plus, les modèles MDL peuvent également surpasser les modèles simples.

See all articles