


La version 3D de SORA est là ! DreamTech lance Direct3D, le premier grand modèle 3D-DiT natif au monde
Représentation efficace du modèle 3D : Image. Et les vidéos peuvent obtenir directement des fonctionnalités latentes grâce à la compression de représentation matricielle 2D/2,5D. En revanche, les données 3D ont une topologie complexe et des dimensions de représentation plus élevées. Comment compresser efficacement des données 3D, puis analyser et apprendre la distribution des données 3D dans l'espace latent 3D est un problème qui a toujours troublé le personnel de l'industrie.
Architecture de formation 3D efficace : L'architecture DiT a été appliquée pour la première fois dans le domaine de la génération d'images et a obtenu un grand succès, notamment Stable Diffusion 3 (SD3) et Hunyuan-DiT. Dans le domaine de la génération vidéo, OpenAI SORA utilise. l'architecture DiT pour obtenir avec succès des effets de génération vidéo qui dépassent de loin ceux de Runway et Pika ; dans le domaine de la génération 3D, limité par une topologie complexe et des méthodes de représentation tridimensionnelle, l'architecture DiT originale ne peut pas être directement appliquée à la génération de maillage 3D.
Données d'entraînement 3D à grande échelle de haute qualité : La qualité et l'échelle des données d'entraînement 3D déterminent directement la qualité et la capacité de généralisation du modèle généré. On pense généralement dans l'industrie qu'il y en a au moins des dizaines de millions. des données de formation 3D de haute qualité sont nécessaires pour répondre aux exigences de formation des grands modèles 3D. Cependant, les données 3D sont extrêmement rares dans le monde. Bien qu'il existe des dizaines de millions d'ensembles de données d'entraînement 3D tels que ObjaverseXL, la plupart d'entre eux sont des structures simples de mauvaise qualité, et les données 3D de haute qualité disponibles représentent moins de 5 %. . Comment obtenir une quantité suffisante de données 3D de haute qualité est un problème mondial.
En réponse aux problèmes fondamentaux ci-dessus, DreamTech a proposé le premier grand modèle 3D-DiT natif au monde, Direct3D. Grâce à une vérification expérimentale approfondie, la qualité de génération de modèles 3D de Direct3D dépasse largement la méthode de dimensionnalité 2D actuelle, qui bénéficie principalement des trois points suivants :
D3D-VAE : Direct3D propose un modèle 3D similaire à OpenAI SORA VAE (Variational Auto-Encoder) est utilisé pour extraire les caractéristiques latentes des données 3D, réduisant ainsi la complexité de représentation des données 3D du N^3 d'origine à un espace latent 3D compact de n^2 (n<
D3D-DiT : Direct3D adopte l'architecture DiT et améliore et optimise le DiT original. Il introduit des modules d'alignement au niveau sémantique et au niveau des pixels pour les images d'entrée, qui peuvent obtenir un alignement élevé du modèle de sortie avec n'importe quelle image d'entrée. .
Moteur de données 3D DreamTech : Direct3D utilise une grande quantité de données 3D de haute qualité dans la formation, dont la plupart sont produites par le moteur de synthèse de données auto-développé par DreamTech. Le moteur de synthèse DreamTech a établi des processus de traitement de données entièrement automatiques tels que le nettoyage et l'annotation des données, et a accumulé et produit plus de 20 millions de données 3D de haute qualité, complétant ainsi la dernière pièce du puzzle pour la mise en œuvre d'algorithmes 3D natifs. Il convient de mentionner qu'OpenAI a essayé d'utiliser des millions de données synthétiques 3D dans le processus de formation de Shap-E et Point-E en 2023. Par rapport à la solution de synthèse de données d'OpenAI, les données 3D synthétisées par DreamTech sont à plus grande échelle et de meilleure qualité. .
La structure géométrique du modèle est déformée et sujette à de longues têtes et queues ; de nombreuses bavures pointues ;
-
La surface est trop lisse et manque de détails ;
la maille présente un petit nombre de taches et la structure fine ne peut pas être garantie ;
L'existence de ces problèmes a empêché les modèles générés par diverses solutions précédentes de pouvoir être imprimés normalement sur les imprimantes 3D, et des ajustements et des réparations manuels sont nécessaires. Étant donné que Direct3D adopte la technologie 3D native et utilise uniquement des données 3D dans l'ensemble de formation, la qualité des modèles 3D qu'il génère est plus proche de la qualité d'origine et résout parfaitement les problèmes fondamentaux tels que la structure géométrique, la précision du modèle, les détails de surface, et le nombre de patchs de maillage. La qualité des modèles générés par Direct3D a dépassé la limite supérieure de précision des imprimantes domestiques. Seules les imprimantes commerciales et industrielles dotées de spécifications plus élevées peuvent restaurer pleinement la précision des modèles générés.


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Mais peut-être qu’il ne pourra pas vaincre le vieil homme dans le parc ? Les Jeux Olympiques de Paris battent leur plein et le tennis de table suscite beaucoup d'intérêt. Dans le même temps, les robots ont également réalisé de nouvelles avancées dans le domaine du tennis de table. DeepMind vient tout juste de proposer le premier agent robot apprenant capable d'atteindre le niveau des joueurs amateurs humains de tennis de table de compétition. Adresse papier : https://arxiv.org/pdf/2408.03906 Quelle est la capacité du robot DeepMind à jouer au tennis de table ? Probablement à égalité avec les joueurs amateurs humains : tant en coup droit qu'en revers : l'adversaire utilise une variété de styles de jeu, et le robot peut également résister : recevoir des services avec des tours différents : Cependant, l'intensité du jeu ne semble pas aussi intense que le vieil homme dans le parc. Pour les robots, le tennis de table

Le 21 août, la Conférence mondiale sur les robots 2024 s'est tenue en grande pompe à Pékin. La marque de robots domestiques de SenseTime, "Yuanluobot SenseRobot", a dévoilé toute sa famille de produits et a récemment lancé le robot de jeu d'échecs Yuanluobot AI - Chess Professional Edition (ci-après dénommé "Yuanluobot SenseRobot"), devenant ainsi le premier robot d'échecs au monde pour le maison. En tant que troisième produit robot jouant aux échecs de Yuanluobo, le nouveau robot Guoxiang a subi un grand nombre de mises à niveau techniques spéciales et d'innovations en matière d'IA et de machines d'ingénierie. Pour la première fois, il a réalisé la capacité de ramasser des pièces d'échecs en trois dimensions. grâce à des griffes mécaniques sur un robot domestique et effectuer des fonctions homme-machine telles que jouer aux échecs, tout le monde joue aux échecs, réviser la notation, etc.

La rentrée scolaire est sur le point de commencer, et ce ne sont pas seulement les étudiants qui sont sur le point de commencer le nouveau semestre qui doivent prendre soin d’eux-mêmes, mais aussi les grands modèles d’IA. Il y a quelque temps, Reddit était rempli d'internautes se plaignant de la paresse de Claude. « Son niveau a beaucoup baissé, il fait souvent des pauses et même la sortie devient très courte. Au cours de la première semaine de sortie, il pouvait traduire un document complet de 4 pages à la fois, mais maintenant il ne peut même plus produire une demi-page. !" https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ dans un post intitulé "Totalement déçu par Claude", plein de

Lors de la World Robot Conference qui se tient à Pékin, l'exposition de robots humanoïdes est devenue le centre absolu de la scène. Sur le stand Stardust Intelligent, l'assistant robot IA S1 a réalisé trois performances majeures de dulcimer, d'arts martiaux et de calligraphie. un espace d'exposition, capable à la fois d'arts littéraires et martiaux, a attiré un grand nombre de publics professionnels et de médias. Le jeu élégant sur les cordes élastiques permet au S1 de démontrer un fonctionnement fin et un contrôle absolu avec vitesse, force et précision. CCTV News a réalisé un reportage spécial sur l'apprentissage par imitation et le contrôle intelligent derrière "Calligraphy". Le fondateur de la société, Lai Jie, a expliqué que derrière les mouvements soyeux, le côté matériel recherche le meilleur contrôle de la force et les indicateurs corporels les plus humains (vitesse, charge). etc.), mais du côté de l'IA, les données réelles de mouvement des personnes sont collectées, permettant au robot de devenir plus fort lorsqu'il rencontre une situation forte et d'apprendre à évoluer rapidement. Et agile

Les contributeurs ont beaucoup gagné de cette conférence ACL. L'ACL2024, d'une durée de six jours, se tient à Bangkok, en Thaïlande. ACL est la plus grande conférence internationale dans le domaine de la linguistique informatique et du traitement du langage naturel. Elle est organisée par l'Association internationale pour la linguistique informatique et a lieu chaque année. L'ACL s'est toujours classée première en termes d'influence académique dans le domaine de la PNL, et c'est également une conférence recommandée par le CCF-A. La conférence ACL de cette année est la 62e et a reçu plus de 400 travaux de pointe dans le domaine de la PNL. Hier après-midi, la conférence a annoncé le meilleur article et d'autres récompenses. Cette fois, il y a 7 Best Paper Awards (deux inédits), 1 Best Theme Paper Award et 35 Outstanding Paper Awards. La conférence a également décerné 3 Resource Paper Awards (ResourceAward) et Social Impact Award (

Intégration profonde de la vision et de l'apprentissage des robots. Lorsque deux mains de robot travaillent ensemble en douceur pour plier des vêtements, verser du thé et emballer des chaussures, associées au robot humanoïde 1X NEO qui a fait la une des journaux récemment, vous pouvez avoir le sentiment : nous semblons entrer dans l'ère des robots. En fait, ces mouvements soyeux sont le produit d’une technologie robotique avancée + d’une conception de cadre exquise + de grands modèles multimodaux. Nous savons que les robots utiles nécessitent souvent des interactions complexes et exquises avec l’environnement, et que l’environnement peut être représenté comme des contraintes dans les domaines spatial et temporel. Par exemple, si vous souhaitez qu'un robot verse du thé, le robot doit d'abord saisir la poignée de la théière et la maintenir verticalement sans renverser le thé, puis la déplacer doucement jusqu'à ce que l'embouchure de la théière soit alignée avec l'embouchure de la tasse. , puis inclinez la théière selon un certain angle. ce

Introduction à la conférence Avec le développement rapide de la science et de la technologie, l'intelligence artificielle est devenue une force importante dans la promotion du progrès social. À notre époque, nous avons la chance d’être témoins et de participer à l’innovation et à l’application de l’intelligence artificielle distribuée (DAI). L’intelligence artificielle distribuée est une branche importante du domaine de l’intelligence artificielle, qui a attiré de plus en plus d’attention ces dernières années. Les agents basés sur de grands modèles de langage (LLM) ont soudainement émergé. En combinant les puissantes capacités de compréhension du langage et de génération des grands modèles, ils ont montré un grand potentiel en matière d'interaction en langage naturel, de raisonnement par connaissances, de planification de tâches, etc. AIAgent reprend le grand modèle de langage et est devenu un sujet brûlant dans le cercle actuel de l'IA. Au

Cet après-midi, Hongmeng Zhixing a officiellement accueilli de nouvelles marques et de nouvelles voitures. Le 6 août, Huawei a organisé la conférence de lancement de nouveaux produits Hongmeng Smart Xingxing S9 et Huawei, réunissant la berline phare intelligente panoramique Xiangjie S9, le nouveau M7Pro et Huawei novaFlip, MatePad Pro 12,2 pouces, le nouveau MatePad Air, Huawei Bisheng With de nombreux nouveaux produits intelligents tous scénarios, notamment la série d'imprimantes laser X1, FreeBuds6i, WATCHFIT3 et l'écran intelligent S5Pro, des voyages intelligents, du bureau intelligent aux vêtements intelligents, Huawei continue de construire un écosystème intelligent complet pour offrir aux consommateurs une expérience intelligente du Internet de tout. Hongmeng Zhixing : Autonomisation approfondie pour promouvoir la modernisation de l'industrie automobile intelligente Huawei s'associe à ses partenaires de l'industrie automobile chinoise pour fournir
