L'engouement pour l'AIGC est apparu depuis l'année dernière, déclenchant une croissance explosive du thème de l'AIGC et de ses applications. De nombreuses personnes déplorent que l'ère de l'intelligence artificielle forte ne soit pas si loin de nous. Mais de l’autre côté du boom, nous constatons qu’il existe encore très peu de scénarios réellement réalisables. Actuellement, les applications les plus réussies se concentrent principalement dans le domaine de la consommation personnelle, tandis que la plupart des applications de l’AIGC sont celles de l’industrie. sont encore au stade exploratoire.
Sequoia Capital a fait la prédiction suivante pour l'AIGC le 22 septembre : la génération d'IA basée sur le texte entrera dans l'âge d'or en 2023, la génération d'IA basée sur l'image arrivera dans l'âge d'or vers 2025, et la génération d'IA 3D et vidéo. pourrait être au stade de projet en 2023 et pourrait entrer dans son âge d’or en 2030. Il est indéniable que la génération de textes et d’images par l’IA est en effet en avance sur la courbe, tandis que la génération de modèles 3D, de vidéos et de jeux est encore en phase de développement.
Prévisions de maturité de Sequoia Capital pour les produits liés à l'AIGC
Si les applications industrielles de l'AIGC sont prises en compte, comme dans les entités verticales géantes telles que la fabrication et la construction, le C/ Contenu Le contenu ne restera plus seulement dans le domaine des images et du texte, mais devra entrer dans un domaine tridimensionnel avec des informations plus riches. Ensuite, nous discuterons de son chemin de développement depuis la technologie AIGC -> produits -> applications métier et réalisation de valeur, et utiliserons des exemples industriels pour explorer comment AIGC peut réaliser des boucles fermées et une mise en œuvre de valeur dans le domaine industriel.
De plus en plus de tests sur ChatGPT, nous pouvons voir que ChatGPT peut non seulement analyser et structurer la sémantique, mais aussi utiliser la PNL sur cette base pour naturellement Le traitement du langage effectue l'analyse des données .
Contenu structuré et analyse de données ChatGPT - fourni par Jiage Data
En fait, un certain nombre de cadres ou de plates-formes de dessin d'IA dirigés par Stable Diffusion, l'année dernière remuer plus tôt. Bien que les images semblent avoir un contenu d'information plus complexe que le texte, leur technologie mûrit plus tôt que la génération de texte dirigée par GPT. Nous devons prendre le cadre open source grand public Stable Diffusion comme exemple pour examiner comment fonctionne le cadre AIGC.
Les images générées par Stable Diffusion ont la capacité d'être comparées à des peintres humains
Stable Diffusion comporte principalement trois composants, chacun possédant son propre réseau neuronal.
1. CLIP est utilisé pour les encodeurs de texte : En utilisant le texte comme information sémantique de sortie pour former une matrice 77*768, CLIP entraîne l'IA à effectuer simultanément une compréhension du langage naturel et une analyse de vision par ordinateur. CLIP peut déterminer le degré de correspondance entre les images et les invites de texte, par exemple en faisant correspondre progressivement l'image d'un bâtiment avec le mot « architecture », et sa formation en capacités est réalisée grâce à plus de 4 milliards d'images avec des descriptions textuelles dans le monde.
Ensemble de formation du CLIP
2, UNET et planificateur : C'est le fameux programme principal du modèle de diffusion (proposé par les équipes CompVis et Runway en décembre 2021) "Latent Diffusion Model " (LDM / Latent Diffusion Model) est utilisé pour prédire le bruit et réaliser le processus de débruitage inverse, réalisant ainsi la génération d'images dans l'espace d'information. Comme le montre l'image, le processus de diffusion du colorant est comme le processus de passage progressif d'une image à un point de bruit lorsque les chercheurs ajoutent des points de bruit aléatoires à l'image et laissent l'IA apprendre à l'envers le processus global. ils disposent ensuite d'un ensemble de méthodes d'apprentissage inverse à partir de la carte de bruit de l'espace d'information, un modèle qui génère des images.
Processus de débruitage inversé du modèle de diffusion
Expliqué avec un exemple populaire, si vous déposez au hasard un colorant dans de l'eau propre, au fil du temps, vous obtiendrez une forme magnifique comme l'image ci-dessous. Existe-t-il donc un moyen de déduire à l'envers des informations telles que le dosage initial du colorant, la séquence et l'état initial d'écoulement dans le réservoir d'eau en fonction d'un état spécifique à un moment précis ? Évidemment, cela est presque impossible à réaliser sans emprunter des méthodes à l’IA.
Différents colorants sont déposés dans l'eau et se diffusent sous différentes formes
3. Décodeur de l'espace d'information en espace d'image réel : C'est-à-dire convertir les informations matricielles dans le espace d'informations Convertir en une image RVB visible à l'œil nu. Imaginez le processus de communication avec les autres. Les signaux sonores que nous entendons sont convertis en signaux textuels que le cerveau peut comprendre et stockés dans le cerveau. Si vous essayez d'exprimer des signaux textuels dans une certaine langue, ce processus peut être appelé décodage - l'expression ici peut être dans n'importe quelle langue, et chaque langue correspond à un décodeur différent. Le décodage n'est qu'un moyen d'expression, et son essence est toujours. basé sur les êtres humains. La description et la compréhension de quelque chose dans l’esprit.
Interprétation de l'ensemble du processus de StableDiffusion de l'entrée à la sortie
C'est précisément avec la série de ces étapes techniques clés que Stable Diffusion a réussi à créer un robot de dessin IA omnipotent, non seulement peut comprendre la sémantique et la convertir en flux d'informations dans l'espace d'information, mais peut également créer grâce à une réduction du bruit simulé dans l'espace d'information, et la restituer en une image visible à l'œil nu via un décodeur. Ce processus plein de science-fiction ne le fait pas. exister dans l'IA Du point de vue du monde, cela peut être qualifié de miracle.
La génération d'images a obtenu des résultats révolutionnaires, mais si ces résultats peuvent être encore optimisés et appliqués à davantage de domaines, il sera possible d'obtenir une plus grande valeur. Nous avons également constaté des résultats d'exploration dans des domaines subdivisés. Par exemple, en comprenant la scène, en ajoutant différents ensembles de données et en ajustant les paramètres, nous pouvons obtenir un meilleur contrôle sur la génération d'images, pas seulement par des essais et des erreurs constants de texte.
2.1 Génération de cartes d'intention de conception
Au début de 2019, la série "Ce XX n'existe pas" générée à l'aide des GAN a reçu beaucoup d'attention à l'étranger. Dans notre pays, nous avons également vu des entreprises lancer des résultats. champs segmentés. L'équipe a également lancé expérimentalement la « AI Creative Library » sur téléphone mobile en août 2022. Il suffit de saisir une phrase et le robot conversationnel peut rapidement comprendre la sémantique en une minute et générer plusieurs images avec des effets détaillés proches du plan conceptuel architectural. diagramme d’intention. De plus, en saisissant une image existante et en modifiant les mots-clés de certaines descriptions, la « AI Creative Library » peut générer une série d'images dérivées pour aider les concepteurs à trouver l'inspiration dans leurs créations quotidiennes.
Xiaoku Technology "Ce bâtiment n'existe pas", le modèle GAN génère des images architecturales et un processus itératif
Photo de gauche : Xiaoku Génération de la "bibliothèque créative IA", déclenchant les déclarations Louis Kahn style, un petit musée entouré de montagnes et de rivières ; image de droite : générée par Xiaoku "AI Creative Library", basée sur l'image de style Louis Kahn à gauche, le style terminé est passé à Le Corbusier
Afin de rendre la "AI Creative Library" plus efficace, l'équipe a réalisé de nouvelles explorations : étant donné que les algorithmes et les modèles existants sont davantage concentrés sur des matériaux Internet généraux, les données des images, descriptions et styles liés à l'architecture sont stockées. Le professionnalisme n'est clairement pas suffisant. Ici, un identifiant spécial pour les mots liés à la construction est utilisé pour former un ensemble de données préalable affiné et l'ensemble de données est fusionné et entraîné pour obtenir une amélioration du modèle. Grâce au nouveau modèle amélioré dans le domaine professionnel de la construction, une bibliothèque créative d'IA dédiée au secteur de la construction a été créée pour les phrases courtes de description de construction, le taux d'excellents produits dans l'ensemble de test a augmenté de 13,6 % par rapport au modèle original.
Schéma de l'algorithme de réglage fin de Google Dreambooth
Par exemple, lors de la saisie d'une image de musée et d'un mot "Zaha Hadid (la défunte architecte de renommée mondiale)", le modèle peut comprendre qu'il est nécessaire de rapprocher le style architectural ou les caractéristiques du musée des œuvres de Zaha Hadid, plutôt que d'ajouter un personnage ou un portrait de Zaha Hadid au musée, ou de créer un portrait caricatural de Zaha Hadid dans le monde de l'IA - c'est souvent l'un des résultats qu'un modèle général renverrait.
Après avoir affiné le modèle architectural, la petite bibliothèque "AI Creative Library" peut pleinement comprendre le sens caché du mot spécial "Zaha Hadid"
2.2 Génération de modèle 3D
Bien que les images bidimensionnelles soient merveilleuses, dans les applications industrielles, elles ne jouent encore pour le moment que le rôle de « bibliothèque d'intentions » si elles veulent devenir un résultat capable d'exprimer avec précision le design à l'avenir. pour évoluer vers la 3D et des dimensions d’information supérieures.
En 2020, alors que l'AIGC n'était pas aussi mature qu'aujourd'hui, l'équipe mentionnée ci-dessus explorait comment utiliser l'IA pour générer des modèles 3D, et lors de l'enseignement de l'atelier DigitalFUTURES à l'Université de Tongji, elle a dévoilé ses recherches. et développement pour générer davantage d'images à partir de graphiques. Quant à l'algorithme du modèle, nous pouvons voir que l'effet du modèle à cette époque n'était pas très satisfaisant, c'est la liaison graphique-image-modèle.
2020 Atelier DigitalFUTURES de l'Université de Tongji Les résultats de l'équipe enseignante de Xiaoku, les graphiques dessinés à la main génèrent des images puis génèrent des modèles
Au cours de la deuxième année d'enseignement de l'atelier DigitalFUTURES de l'Université de Tongji, l'équipe a publié un algorithme qui utilise les GAN pour apprendre la relation entre les graphiques et les modèles tridimensionnels réels, et génère des graphiques dans des modèles tridimensionnels réels. En apprenant les caractéristiques de différents éléments de couche sur l'image, cet algorithme peut restaurer grossièrement la forme étirée tridimensionnelle de l'objet principal correspondant à l'image et prédire la hauteur de l'objet d'origine correspondant à la projection de différents objets. Bien entendu, cette méthode présente encore certains défauts. Elle ne peut être utilisée que dans des scènes d'images, et il est difficile d'accumuler la relation entre des images similaires et des formes tridimensionnelles dans d'autres scènes. Deuxièmement, la forme tridimensionnelle restaurée ne peut être que grossièrement. prédire la hauteur et d'autres détails doivent être transmis. L'algorithme est régénéré, ce qui présente une erreur importante avec le modèle tridimensionnel réel. Il ne peut être utilisé que pour les premières recherches et jugements du projet, et les scénarios d'application sont limités. .
Schéma schématique de la formation à l'extraction de caractéristiques hiérarchiques pour un modèle 3D urbain
2 021 Atelier DigitalFUTURES de l'Université de Tongji Résultats de l'équipe pédagogique de Xiaoku, basés sur le GANS Modèle 3D de reconstruction de figurine
Grâce à l'explosion des algorithmes AIGC et à la maturité croissante des algorithmes de génération 3D, nous avons également vu des entreprises verticales d'IA commencer à absorber des technologies et des idées plus avancées pour améliorer leurs modèles, et avoir de nouvelles idées sur la voie 3D-AIGC. direction à essayer. Par exemple, OPENAI a lancé le framework Point-E, qui peut prédire n'importe quelle image bidimensionnelle dans un nuage de points grâce à un algorithme, puis prédire des objets tridimensionnels via le nuage de points.
Schéma schématique de l'ensemble du processus du framework PointE
Cependant, la qualité de la génération du modèle présente encore certaines limites, et l'inutilisabilité du modèle se reflète principalement dans ce qui suit trois aspects :
1. Difficulté à restaurer des formes 3D : Tout d'abord, les données d'image 2D sont apparues plus tôt que les données de modèle 3D. En même temps, il y a actuellement plus de données d'image 2D disponibles que ces dernières. peut être utilisé comme matériel de formation en plus grande quantité, tandis que moins de données de modèle 3D peuvent être utilisées. La capacité de généralisation du matériel de formation du modèle est limitée et il est difficile de restaurer la forme tridimensionnelle originale
2. manque de matériaux : la partie la plus importante pour un modèle tridimensionnel est le remplissage et la sélection des matériaux. Cependant, pour la génération d'IA, la méthode d'estimation directe du matériau à partir de l'image n'est pas encore mature. Le même matériau se comporte différemment sous des conditions différentes. les formes, les environnements et les sources de lumière. Lorsque ces variables sont concentrées dans une seule image, la reconstruction matérielle est presque impossible
3 La précision du modèle généré n'est pas à la hauteur : les modèles affinés via des nuages de points s'appuient généralement sur densité du nuage de points pour reconstruire le maillage de la surface de l'objet. S'il y a trop peu de nuages de points, l'objet sera gravement déformé et le modèle risque même de ne pas être reconstruit.
L'équipe Xiaoku a testé le modèle Point-E. L'image architecturale de gauche a généré un nuage de points et simulé le modèle tridimensionnel de droite. Malheureusement, ce que nous avons obtenu n'était qu'un nuage de points. un tas de modèles de nuages de points dénués de sens. Point-E temporairement Je n'arrive toujours pas à comprendre une image d'un bâtiment
Bien sûr, nous pouvons comprendre le goulot d'étranglement technique actuel Si nous fixons l'objectif un peu plus bas, choisissez une forme simple. généré à partir d'un logiciel de modélisation 3D et faites une capture d'écran 2D. En reconstruisant en modèle point-e, vous constaterez étonnamment que l'effet est meilleur que le test ci-dessus, mais il est encore limité à la portée d'un "avant-projet". Ceci est étroitement lié à l'ensemble d'entraînement. La génération de vues 2D depuis chaque perspective via un logiciel de modélisation 3D est l'un des moyens les plus simples d'obtenir des données d'entraînement pour ce modèle.
L'équipe Xiaoku a testé le modèle Point-E, sélectionné un modèle 3D simple dans le logiciel de modélisation pour prendre des captures d'écran sous n'importe quel angle et reconstruit le modèle 3D, souvent avec d'assez bons résultats
Pour résumer, le parcours technique allant du texte -> image -> nuage de points -> objet tridimensionnel est en effet étonnant, mais s'il doit être appliqué dans le domaine industriel, il reste encore beaucoup de travail à faire. à réaliser par des scientifiques en IA.
Mais est-ce la seule voie technique pour parvenir à la génération de modèles 3D ?
Dans le développement de grands modèles dans des domaines généraux, les fabricants dirigés par OpenAI, notamment des géants tels que Nvidia et Google, lancent également leurs propres frameworks 3D-AIGC universels. , C'est encore à ses débuts. Pour les industries physiques verticales, il reste évidemment encore un long chemin à parcourir avant les applications pratiques.
D'un point de vue mondial, dans le domaine de la génération de modèles 3D, en plus des grands modèles pan-field, certaines industries verticales explorent également comment appliquer l'AIGC. Par exemple, Siemens effectue une simulation politique et une optimisation plus poussée du modèle généré lors de la conception et de la fabrication du moteur. Enfin, grâce à des entités d'impression 3D, elle réalise la génération de modèles 3D, la fourniture de résultats et la boucle commerciale.
Siemens met en œuvre la conception et la simulation de moteurs via des algorithmes génératifs
La réalisation de tels résultats dépend de l'itération continue du contenu métier sous-jacent et de ses normes de données dans le cadre d'une logique industrielle.
La définition standard numérique du contenu est SMART (Standards Machine Applicable, Readable and Transferable) selon ISO/IEC : le niveau L1 est un texte papier, aucune interaction machine n'est possible. L2 Le niveau L3 est un format numérique ouvert avec très faible interactivité machine ; le niveau L3 est un document lisible par la machine, mais la machine ne peut pas comprendre les résultats et le contenu de la récupération ; le niveau L4 est un contenu lisible par la machine qui peut interagir sémantiquement, mais la machine ne peut pas comprendre la relation logique du contexte. ; Niveau L5, contenu interactif par machine, qui peut réaliser des attributs intelligents tels que l'identification automatique et la génération automatique.
Dans le domaine industriel, le contenu informationnel de niveau L3 est actuellement largement utilisé et le contenu numérique de niveau L4 est en cours de développement, tandis que l'intelligence de niveau L5 est le fondement de l'Industrie 4.0 et de la fabrication intelligente. Par conséquent, générer du contenu lisible par machine au-dessus du niveau L4, en particulier du contenu intelligent de niveau L5, est l’orientation future de l’AIGC.
ISO/IEC SMART Digital Standard « China Engineering Science » Volume 23 Numéro 6, 2021 « Recherche sur l'état de développement et les tendances de la numérisation standard » Liu Xize, Wang Yiyi, Du Xiaoyan, Li Jia, Che Di
L'étranger a commencé à pratiquer l'AIGC dans le domaine des applications industrielles, alors que l'exploration nationale est encore relativement rare, mais nous avons également trouvé des entreprises profondément impliquées dans les domaines verticaux. Par exemple, comme mentionné ci-dessus, l'équipe technologique de Xiaoku est profondément impliquée dans le secteur de la construction. Nous prendrons l'exemple du secteur de la construction pour discuter de la voie de mise en œuvre de l'AIGC dans les industries verticales.
L'économie réelle nationale actuelle est dans une période de transformation. Le niveau national a proposé la tâche importante de « l'intégration de l'intelligence artificielle et de l'économie réelle ». Les grandes industries sont impatientes de mettre en œuvre la technologie de l'IA pour aider les industries à atteindre le numérique. et des mises à niveau intelligentes, plutôt qu'un produit DEMO qui reste en concept, ou une chose amusante à discuter après le dîner.
L'industrie de la construction est une industrie pilier nationale avec un chiffre d'affaires annuel de près de 30 000 milliards, mais son niveau de numérisation se classe au dernier rang parmi toutes les industries du pays. À l'heure actuelle, le pays propose des politiques de construction intelligentes et espère atteindre un nouveau niveau de « Made in China ». La construction intelligente est basée sur l'industrialisation des nouveaux bâtiments (industrialisation/préfabriqués, numériques, intelligents), basée sur l'intégration profonde des technologies de l'information de nouvelle génération et des technologies de construction avancées, et traverse tous les aspects des activités de construction tels que la conception, la production, la construction, l'exploitation. et maintenance et supervision. , qui présente les caractéristiques de la perception de soi, de la prise de décision personnelle, de l'auto-exécution, de l'auto-adaptation et de l'auto-apprentissage, et constitue une méthode de construction avancée visant à optimiser la qualité, l'efficacité et la supervision. la compétitivité fondamentale de l'ensemble du cycle de vie du secteur de la construction.
Valeur et croissance de la production totale du secteur de la construction en Chine de 2011 à 2021 - Bureau national des statistiques - Foresight Industry Research Institute,
Information Science et Institut de recherche technologique : Gartner ; Kable ; OCDE ; Bureau central des statistiques ; analyse du McKinsey Global Institute
Dans le secteur de la construction, les normes de données sous-jacentes passent de l'ère de la CAO des documents lisibles par machine au niveau L3 au niveau L4. BIM avec contenu lisible par machine Les temps avancent. L'exigence pour les modèles 3D dans l'industrie de la construction est que l'objet de contenu contienne des informations précises en pleine dimension dans un espace tridimensionnel, y compris le modèle, les données et d'autres dimensions. S'il peut également inclure des dimensions de règle, il peut alors avoir une auto-perception. auto-apprentissage, auto-itération, etc. Capacités intelligentes. À l'heure actuelle, les logiciels d'application CAO de niveau L3 et BIM de niveau L4 sont monopolisés par les pays étrangers. Notre espace et notre potentiel de développement doivent être concentrés sur des logiciels de niveau L5 capables de couvrir de petites dimensions avec des dimensions élevées.
Format de contenu SMART standard numérique dans le domaine de la construction
Sur la base d'informations sur la transformation numérique du secteur de la construction, l'équipe Xiaoku a réalisé que la couche inférieure de données de l'ensemble du secteur devait être redéfini. Depuis sa création en 2016, elle s'est engagée dans la recherche et le développement de la technologie sous-jacente du modèle 3D AIGC de niveau L5 et de son application dans l'industrie de la construction. Basé sur un ensemble de systèmes d'IA contenant une logique de flux métier, le contenu connectable « à l'échelle du modèle numérique », comprenant des informations sur le bâtiment, des données multidimensionnelles, des modèles 3D et des règles/normes/lois, est généré pour réaliser la génération intelligente de conception architecturale. plans.
Ces données sous-jacentes, l'équipe les appelle Modèle d'information du bâtiment piloté par l'IA sur le cloud Modèle d'information du bâtiment (ABC) cloud généré par l'intelligence artificielle, et attribue la réalisation de la génération intelligente à quatre étapes pratiques : IA Identifier le contenu existant pour formation ou reconstruction de données structurées, évaluer et simuler les données, optimiser les résultats préliminaires des données et enfin générer des résultats commerciaux composés d'une série de modèles d'IA.
Format intelligent de construction de niveau L5 Modèle de cloud intelligent ABC
Reconnaissance IA champ, l'équipe nettoie et forme des dizaines de millions de données de dessin CAO de différents types d'entreprises, obtenues Restauration du cloud à 100 % et analyse sémantique précise à 99,8 %* et supplémentation des dessins CAO sémantiques de niveau L3, atteignant le niveau avancé mondial dans ce domaine. Cette réussite a été largement appliquée à de nombreux produits et solutions de l'entreprise. Par exemple, la « révision intelligente des dessins » pour la révision des dessins de construction a un taux de précision de révision des clauses d'environ 96 %.
Composant de dessin de construction de petite bibliothèque et identification de l'espace
Champ d'analyse de l'IA, basé sur l'identification efficace des projets, pour les types de bâtiments civils courants tels que les résidences et les centres commerciaux, permettant l'équipe pour effectuer l'analyse de simulation de l'environnement physique, la simulation et la prévision des données sur le comportement humain, ainsi que l'analyse et la simulation des mégadonnées liées au projet. Au niveau des applications, il peut aider les clients dans l'analyse quantitative des plans de projet. Par exemple, en évaluant la gamme complète de produits résidentiels des sociétés immobilières, différents coefficients d'évaluation de la valeur peuvent être obtenus pour aider les sociétés immobilières à améliorer la qualité des produits. Par conséquent, Xiaoku Technology a également été sélectionnée comme premier juge en IA du concours de conception de maisons de la China Housing Association. Cette capacité a également été appliquée au développement et à l'exploitation de plus de dix centres commerciaux à Hong Kong et en Chine.
小ku「Product Power Value Assessment」
Dans le domaine de l'optimisation de l'IA, l'équipe estime que « l'optimisation » est basée sur une optimisation plus poussée après « l'identification » de la précommande " et "analyse" Itération, c'est-à-dire régénérer de meilleurs résultats basés sur le contenu existant. Ce type de technologie est déjà utilisé dans des produits et solutions spécifiques à l'entreprise. Par exemple, dans la fonction « Smart Sunshine Optimization » de la version Design Cloud 2022, Xiaoku peut affiner automatiquement les solutions qui n'ont pas réussi à passer l'ensoleillement, afin qu'elles puissent réussir la vérification de l'ensoleillement sans apporter d'énormes ajustements au modèle d'origine. Cette capacité est également utilisée dans le développement de solutions architecturales, telles que des scénarios d’optimisation de conception de murs-rideaux. Dans un projet de mur-rideau de musée au Sichuan en coopération avec l'Institut provincial de design commercial du Sichuan, l'algorithme Xiaoku a optimisé plus de 30 000 panneaux de mur-rideau triangulaires irréguliers originaux en 12 types de modules standard, ce qui est inférieur aux 116 types actuels. peut réduire à. Réduit de 90 %, le coût de construction des murs-rideaux sera considérablement réduit en raison de la réduction du SKU et de la quantité de moules.
Xiaoku "algorithme d'IA d'optimisation des murs-rideaux"
Le domaine de la génération d'IA est au cœur de la conception intelligente. Pour le secteur de la construction, choisir un plan de conception économique, applicable et esthétique et fournir des résultats de construction sûrs, efficaces et de haute qualité nécessite la coordination de plusieurs disciplines et rôles. Il doit non seulement être décomposé un par un, de l'échelle macro à l'échelle méso puis à l'échelle micro, mais doit également être progressivement couvert dans de multiples domaines tels que l'architecture, la structure, l'électromécanique, la plomberie et le paysage. Il doit également couvrir les logements, les appartements, les industries, les bureaux, les commerces, etc. Par conséquent, la génération de résultats professionnels dans des domaines verticaux ne peut pas être résolue par un seul modèle, algorithme et ensemble de données. Elle nécessite l'intégration organique de plusieurs technologies telles que des multi-modèles, des multi-modalités et des ensembles de données multiples avec l'entreprise. logique, grâce à une conception de produit adaptée aux scénarios segmentés et une itération continue basée sur les commentaires des utilisateurs peut enfin y parvenir.
À partir de la logique métier, l'équipe Xiaoku a trié les 24 étapes du processus métier requises pour la conception architecturale traditionnelle, extrait et reconstruit le contenu de base en 6 modules métier et a établi un système d'IA et une architecture cloud comme noyau Un nouvel ensemble de conception architecturale Processus métier AIGC : Ajuster (appel d'information et reconnaissance de l'IA), faire (génération complète de l'IA et génération de collaboration homme-machine), modifier (modification manuelle et optimisation de l'IA), révision (vérification des données et révision de l'IA), collaboration ( collaboration à plusieurs personnes et gestion d'entreprise dans le cloud), exportation (sortie automatique de plus de formats - modèles 3D/dessins 2D/images/PPT/Excel, etc.).
Image de gauche : 24 étapes du processus métier original de la conception architecturale, image de droite : Xiaoku est restructuré en 6 sections de processus métier prises en charge par l'IA
Basé sur la compréhension métier en profondeur comprendre et reconstruire la logique métier et intégrer en profondeur les 6 principaux modules commerciaux avec des technologies telles que la reconnaissance de l'IA, la génération de l'IA, le big data et la collaboration cloud dans la conception de produits, en réalisant la planification architecturale, la conception unique, la génération de composants et d'autres profondeurs différentes. Les besoins des entreprises de construction, de l'analyse à la conception, en passant par l'examen, la collaboration et la production, couvrent progressivement l'étendue et la profondeur des exigences du secteur résidentiel.
Produit "Xiaoku Design Cloud - Planification architecturale" 6 modules majeurs
Produit "Xiaoku Design Cloud - Building Individual" 6 modules majeurs
Dans la plupart des secteurs, l'application de l'AIGC en est encore à ses balbutiements, et le développement continu de la technologie globale de l'IA favorisera les applications innovantes ultérieures de l'AIGC. En prenant comme exemple la pratique actuelle dans le secteur de la construction, l'AIGC peut actuellement aider à améliorer des scénarios commerciaux spécifiques qui ont des exigences d'efficacité plus élevées dans certains scénarios commerciaux détaillés qui génèrent une valeur perceptible par l'utilisateur, tels que la recherche d'investissement, la conception, l'évaluation, etc. dans le secteur de la gestion et de la construction.
4.1 Gain de solution optimale et amélioration de l'efficacité
Dans la phase d'investissement et de recherche du secteur de la construction, la politique de « deux concentrations » (offre centralisée de terrains et acquisition centralisée de terrains) introduite en 2021 a concentré une grande quantité de terrain en un Lancée ce mois-ci, les sociétés de développement doivent terminer l'évaluation des investissements de chaque terrain dans un court laps de temps. L'essentiel est de savoir comment trouver la solution de planification de construction optimale sur un terrain à obtenir. la valeur maximale du produit et le calcul du retour sur investissement. Au départ, il fallait au moins 3 à 5 jours pour réaliser un plan conceptuel de planification résidentielle, ce qui n'était pas en mesure de répondre aux besoins de l'entreprise. Cela a soulevé la nécessité d'une efficacité extrême dans les plans de planification architecturale préalables à l'investissement.
L'équipe Xiaoku a lancé le plan de planification architecturale de l'AIGC, et il ne faut qu'environ 30 % du temps initial pour produire le plan préliminaire. Plus important encore, l’IA peut générer et optimiser des solutions auxquelles les gens n’ont pas pensé ou qui sont difficiles à affiner manuellement de manière exhaustive, obtenant ainsi de meilleurs résultats en termes de performances ou d’économie. Par exemple, dans un projet du Jiangxi de la Chine Jinmao, le plan généré par l'IA a non seulement pris seulement 20 % de la méthode originale dans le temps, mais a également augmenté la valeur totale du projet de 56 millions de yuans par rapport au plan initial. Sur le marché des enchères immobilières au cours des neuf mois de 2021, l'équipe a réalisé près d'un millier de projets et près de dix mille plans, aidant les clients à obtenir avec succès des dizaines de terrains.
L'IA "Xiaoku Design Cloud" génère un plan d'acquisition de terrains résidentiels réels
4.2 Réduction des coûts, économies d'énergie et réduction des émissions
Dans le processus de construction du bâtiment, l'équipe Xiaoku combine IA avec la méthode de conception DFMA (Design For Manufacture and Assembly), et s'associe à China Construction Science and Technology, une filiale du géant de la construction China Construction Group, pour combiner des bâtiments préfabriqués de type boîte avec la génération de conception IA, L5 ABC The l'intégration profonde de la liaison « données-échelle du moule » réalise la liaison en temps réel de l'investissement-plan-coût avant la mise en œuvre, réduit les modifications de conception et de coûts de 80 % et réduit efficacement le SKU global des composants d'assemblage et le volume d'ouverture du moule, atteignant 50 % % ou plus d'économie d'énergie et de réduction des émissions. Tout en obtenant de meilleures performances et de meilleurs résultats économiques, les « données natives » peuvent être efficacement connectées aux lignes de production des usines et aux chantiers de construction intelligents en « données jumelles ». Dans un projet hôtelier à Shenzhen, la conception à la construction a été achevée en 4 mois, ce qui a considérablement raccourci la période totale de construction d'au moins 14 mois et permis d'économiser plus de 60 % du temps.
Un hôtel à Shenzhen a coopéré avec "Xiaoku Assembly Cloud" et China Construction Science and Technology, l'ensemble du processus de conception intelligente et de construction intelligente)
L5 construction intelligente de niveau Comparaison entre le modèle et le modèle traditionnel
Comme le montrent les cas ci-dessus, l'AIGC de niveau L5 peut partir de la source de génération de données et peut aider efficacement la chaîne industrielle à atteindre des niveaux plus élevés grâce à applications spécifiques de scénarios subdivisés dans chaque maillon de la chaîne industrielle. L'ensemble du cycle de vie, la qualité, l'efficacité et la compétitivité de base. À l'avenir, l'AIGC a tendance à passer du texte et des images à des résultats de contenu 3D et L5 de plus grande dimension. Ce n'est pas seulement l'attente future de l'intelligence artificielle dans le secteur de la construction, mais aussi l'attente commune de tous les secteurs verticaux. industries.
Remarque : *Sur la base du fait qu'il n'y a pas d'erreurs évidentes dans les couches, le taux de précision actuel de la reconnaissance de l'IA de Xiaoku est de 99,8 % pour les composants standard (portes, fenêtres, murs, escaliers, ascenseurs, climatiseurs, bouches d'incendie). , places de parking), etc. (L'ensemble de tests se compose de milliers de dessins CAO architecturaux, et les dessins proviennent des bibliothèques de normes internes de plusieurs développeurs de premier plan)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!