L'IA et l'apprentissage profond sont déjà partout, et ils ont désormais le potentiel de remodeler le paysage urbain. Les modèles d'apprentissage profond qui analysent les images de paysages peuvent aider les urbanistes à visualiser les plans de réaménagement, à améliorer l'esthétique et à éviter des erreurs coûteuses. Cependant, pour que ces modèles soient efficaces, ils doivent identifier et classer avec précision les éléments des images, un défi connu sous le nom de segmentation des instances. Ce défi survient en raison du manque de données de formation appropriées, car la génération d'étiquettes d'images précises de « vérité terrain » implique une segmentation manuelle à forte intensité de main-d'œuvre. Cependant, un article récent suggère qu'une équipe a peut-être trouvé la réponse
Des chercheurs de l'Université d'Osaka ont formé des modèles gourmands en données en tirant parti de simulations informatiques basées sur l'intelligence artificielle pour concevoir une méthode permettant de résoudre ce problème. Leur approche consiste à créer un modèle 3D réaliste de la ville pour générer des segmentations de vérité terrain. Le modèle image à image génère ensuite des images réalistes basées sur des données de vérité terrain. Ce processus aboutit à un ensemble de données d'image réaliste qui ressemble à une ville réelle, complété par des étiquettes de vérité terrain générées avec précision, éliminant ainsi le besoin de segmentation manuelle.
Bien que les données synthétiques aient déjà été utilisées pour l'apprentissage profond, leur approche est différente, créant suffisamment de données de formation pour des modèles du monde réel grâce à des simulations de structures urbaines. En générant de manière procédurale des modèles 3D de villes réalistes et en utilisant un moteur de jeu pour créer des images segmentées, ils peuvent former un réseau antagoniste génératif pour convertir des formes en images avec des textures urbaines réalistes, générant ainsi des images de vue de rue.
Avec cette approche, il n'est plus nécessaire d'utiliser des ensembles de données accessibles au public sur les bâtiments réels, tout en étant capable d'isoler des objets individuels même s'ils se chevauchent dans l'image. Cette approche réduit considérablement les coûts de main-d'œuvre tout en générant des données de formation de haute qualité. Pour vérifier son efficacité, les chercheurs ont formé le modèle de segmentation sur des données simulées et l'ont comparé à un modèle formé sur des données réelles. Les résultats ont montré que le modèle d'IA fonctionnait de manière similaire sur des instances impliquant de grands bâtiments uniques, mais avec des temps de préparation des ensembles de données considérablement réduits. Les chercheurs visaient à améliorer les performances du modèle image à image dans différentes conditions. Leur réalisation résout non seulement le manque de données de formation, mais réduit également les coûts associés à la préparation des ensembles de données, ouvrant ainsi la voie à une nouvelle ère d’aménagement paysager urbain assisté par l’apprentissage profond.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!