ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-d'œuvre, publiés par l'Université Tsinghua et d'autres universités-IA-php.cn

Table des matières

Introduction à la méthode

Vérification de faisabilité

Résumé

Recherches connexes menées par l'équipe

Maison

Périphériques technologiques

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-d'œuvre, publiés par l'Université Tsinghua et d'autres universités

王林

Nov 14, 2023 pm 09:37 PM

数据训练

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

Adresse du projet : https://github.com/OpenBMB/ProAgent
Adresse papier : https://github.com/OpenBMB/ProAgent/blob/main/paper/paper. pdf

Dans la longue histoire du développement technologique humain, l'automatisation a toujours été la principale force motrice, aidant les humains à se libérer d'environnements de travail complexes, dangereux et fastidieux. De l'irrigation par roue hydraulique au début de l'ère agricole aux moteurs à vapeur de l'ère industrielle, les humains ont constamment recherché des technologies d'automatisation plus avancées pour se libérer d'un travail ardu.

Avec l'avènement de l'ère de l'information, les logiciels sont utilisés comme outil de traitement de l'information. , Les fondements du stockage et de la communication sont devenus une partie indissociable de la production et de la vie humaines, ce qui a conduit à la formation de la technologie d'automatisation des processus robotiques (RPA). Il coordonne plusieurs logiciels dans un flux de travail solidifié (Workflow) via des règles compilées manuellement et interagit avec les logiciels pour obtenir une exécution efficace en simulant l'interaction humaine.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

Dans ce graphique, nous comparons l'automatisation des processus robotiques (RPA) avec l'automatisation des processus d'agent (APA)

RPA (Robotic Process Automation) utilise des robots logiciels ou « BOT » pour simuler et effectuer des tâches répétitives et régulières. pour libérer des ressources humaines et améliorer l’efficacité du travail. Le champ d’application du RPA est très large. De nombreuses entreprises (notamment les banques, les compagnies d'assurance, les industries manufacturières, de vente au détail et autres) utilisent généralement des robots RPA pour automatiser les tâches routinières et fastidieuses, telles que la saisie, l'extraction et le traitement des données. En automatisant les tâches, la RPA peut réduire considérablement les taux d'erreur et être capable d'effectuer des tâches 24 heures sur 24, 7 jours sur 7, améliorant ainsi la fiabilité et la réactivité de l'entreprise.

Selon des études de marché, le marché de la RPA connaît une croissance rapide et connaît un grand succès. Gartner prévoit que les revenus du marché mondial de la RPA atteindront 3,3 milliards de dollars d'ici 2023, avec un taux de croissance de 17,5 %. Cela montre que les entreprises ont une demande et une reconnaissance très élevées pour la RPA

Cependant, la RPA ne peut remplacer que le travail humain simple et mécanique, et certains processus complexes reposent encore sur du travail manuel :

L'écriture du flux de travail RPA lui-même nécessite beaucoup de travail. travail Le travail humain coûte plus cher.
Les tâches complexes sont très flexibles et impliquent généralement des décisions dynamiques, difficiles à concrétiser en règles d'expression.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

Figure 2 Comparaison de l'efficacité et de l'intelligence entre la RPA et l'APA

Heureusement, l'émergence récente de la technologie des agents à grand modèle de langage (Large Language Model based Agents, LLM-based Agents) dans le domaine de L'IA peut donner La technologie d'automatisation crée de nouvelles possibilités. Est-il possible d'introduire la flexibilité de la technologie Agent dans le domaine de la RPA pour réduire davantage la participation humaine ?

Les recherches de l’équipe explorent le nouveau paradigme d’automatisation « Agentic Process Automation » (APA) à l’ère des grands agents modèles. Par rapport à la RPA traditionnelle, dans le paradigme APA, l'agent peut compléter de manière autonome la construction du flux de travail en fonction des besoins humains. En même temps, il peut identifier les parties des besoins humains qui nécessitent une prise de décision dynamique, les orchestrer automatiquement dans le flux de travail. et exécuter le flux de travail lorsque le flux de travail est exécuté. Cette partie prend activement en charge l'exécution du flux de travail pour terminer les décisions complexes correspondantes.

Afin d'explorer la possibilité de l'APA, ce travail de recherche a mis en œuvre un agent automatisé ProAgent, qui peut recevoir des instructions humaines et créer des flux de travail en générant du code. DataAgent et ControlAgent sont également introduits dans le flux de travail pour mettre en œuvre un traitement de données et une logique complexes. contrôle. Les recherches de ProAgent démontrent la faisabilité de l'APA à l'ère des agents à grande échelle et révèlent également de nouvelles possibilités pour la technologie d'automatisation à l'ère du LLM.

Introduction à la méthode

Dans RPA, un workflow est une structure graphique composée d'une série d'appels d'outils : les nœuds représentent les appels d'outils atomiques (tels que Gmail, Twitter, Google Sheets) et les bords représentent la séquence logique d'exécution ( rejoindre, brancher, boucle). Un flux de travail contient généralement toutes les connaissances préalables sur une tâche ou un type de tâche, y compris les chemins de résolution de problèmes et la logique de gestion des exceptions. Par conséquent, l'écriture de workflows fixes est souvent très stable, approfondie et efficace

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

Figure 3 Exemple de langage de description de flux de travail d'agent

Dans ProAgent, puisque LLM lui-même est pré-entraîné aux données de code et a acquis de solides capacités de code, cette étude utilise un langage de description de flux de travail d'agent basé sur du code Description de flux de travail d'agent Langue. Ce langage utilise JSON pour organiser et gérer les données dans le flux de travail, et utilise la syntaxe Python pour implémenter le contrôle logique du flux de travail. Les sauts, boucles, etc. dans le flux de contrôle sont directement représentés via la syntaxe Python, et les outils du flux de travail sont les suivants. L'appel est encapsulé en tant que fonction Python. Ainsi, pour ProAgent, les tâches de création de workflow sont transformées en tâches de génération de code. Lors de la réception d'instructions humaines, ProAgent écrit le langage de description de flux de travail agent correspondant, réalisant ainsi une construction de flux de travail automatisée.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

Figure 4 Exemple de langage de description de flux de travail d'agent combinant DataAgent et ControlAgent

Les tâches complexes de la vie réelle impliquent généralement une prise de décision dynamique, des règles de contrôle logiques simples de style Python et une organisation des données de style JSON. la forme est impuissante face à des demandes flexibles, et un agent doit être introduit à ce moment-là. Par conséquent, ce travail de recherche définit plus en détail deux opérations Agent :

1. DataAgent : Pour un besoin de traitement de données complexe, le langage naturel sera utilisé pour décrire les tâches de traitement lorsque le workflow est construit, puis initialisé lors de l'exécution. Un DataAgent qui traitera et terminera de manière autonome la tâche de traitement des données sur la base de la description en langage naturel.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

2. ControlAgent : pour les règles de contrôle logiques difficiles à exprimer par des règles, le langage naturel est utilisé pour décrire la logique de contrôle lors de la construction du flux de travail, puis un ControlAgent est initialisé au moment de l'exécution, ce qui est décrit. en fonction du langage naturel, sélectionnez indépendamment les branches qui doivent être exécutées ultérieurement dans le flux de travail.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

ProAgent utilise le mode ReACT pour créer un flux de travail étape par étape, qui contient quatre étapes de création de flux de travail :

Action_Define : décidez quels outils ajouter au flux de travail.
Action Implémenter : Convertissez les paramètres d'entrée/sortie de l'outil dans une structure JSON et encapsulez l'appel de l'outil dans une fonction Python.
Workflow Implémentation : définissez une fonction mainWorkflow pour organiser le contrôle logique et le traitement des données de l'ensemble du flux de travail.
Soumission de la tâche : lorsque ProAgent termine la création du flux de travail, cette opération marque la fin du processus de création.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

L'exemple montre la figure 5 du processus de construction du flux de travail ProAgent

De plus, afin d'optimiser l'effet de ProAgent, plusieurs techniques d'optimisation sont introduites :

1.Testing- sur -Construction : pendant le processus de construction, ProAgent testera le workflow après l'avoir modifié une fois pour garantir l'exactitude du workflow.
Appel de fonction : toutes les opérations de construction de flux de travail sont encapsulées dans des fonctions GPT-4, améliorant ainsi le contrôle sur le processus de construction de flux de travail.
Chaîne de pensée : lorsque ProAgent écrit du code de workflow, il est nécessaire de donner des commentaires et un plan d'écriture pour chaque fonction afin d'améliorer les performances de construction du workflow ProAgent.

Le processus d'exécution du workflow est basé sur l'interpréteur Python. Lorsqu'un workflow est donné, la fonction mainWorkflow correspondante est utilisée comme point d'entrée pour l'exécution, démarrant ainsi l'ensemble du processus d'exécution. Le processus d'exécution suit les règles d'exécution du code Python, c'est-à-dire qu'il est exécuté ligne par ligne dans l'ordre. Une fois la fonction mainWorkflow renvoyée, l'exécution du workflow est terminée avec succès

Vérification de faisabilité

Afin de vérifier la faisabilité de l'automatisation des processus agentiques, cette étude a utilisé OpenAI GPT-4 comme modèle de base et une plate-forme RPA open source n8n comme support pour implémenter le ProAgent mentionné ci-dessus. Dans le même temps, nous avons conçu une tâche qui nécessite à la fois flexibilité et efficacité : il s'agit d'un scénario commercial typique, qui nécessite d'extraire les données de bénéfices de divers secteurs d'activité à partir de Google Sheets et de déterminer les actions ultérieures selon que l'entreprise est 2B ou 2C. Une fois que le secteur d’activité est déterminé comme étant 2C, un message est envoyé au canal Slack. Pour les métiers de 2B, un email est envoyé au responsable concerné, qui comprend une évaluation du métier et un bref aperçu de la rentabilité.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

Figure 6 Affichage des instructions de tâche

Le contenu qui doit être réécrit est le suivant : Pour cette tâche, tout d'abord, il s'agit d'une tâche répétitive. Pour plusieurs lignes de produits, le même flux de traitement doit être. adopté. Deuxièmement, il est très difficile de distinguer si un secteur d'activité est 2C ou 2B, et cela nécessite une prise de décision dynamique de la part de l'agent pour déterminer le flux de travail ultérieur. Enfin, la rédaction de l'email d'évaluation du métier demande une certaine intelligence, l'intervention de l'Agent est donc nécessaire

Dans la génération ProAgent, pour cette tâche, un workflow contenant quatre opérations atomiques, un DataAgent et un ControlAgent a été écrit. Le processus global est représenté grossièrement dans la figure ci-dessous :

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités Figure 7 Affichage du processus de construction du workflow ProAgent

On peut voir que ProAgent termine automatiquement le processus de construction du workflow en écrivant son propre code, sans impliquer de travail manuel. intervention. Lorsqu'il est nécessaire de déterminer si le secteur d'activité est 2B ou 2C, ProAgent introduit ControlAgent pour effectuer le jugement. L'invite de ControlAgent est définie sur « Décider si le secteur d'activité est toC ou toB ». Lorsque le secteur d'activité est 2B, ProAgent introduit également un DataAgent, dont la tâche est de "Rédiger un email du secteur d'activité de profit, accompagné de votre suggestion", utilisant ainsi l'intelligence de l'agent pour écrire en fonction de la situation réelle de différents métiers du courrier.

Une fois le flux de travail écrit et solidifié, le flux de travail se branche automatiquement vers différentes logiques en fonction de différentes données pour un traitement efficace des données.

ProAgent : des agents intelligents dirigés par OpenAI libèrent de la main-dœuvre, publiés par lUniversité Tsinghua et dautres universités

Figure 8 Affichage du processus d'exécution du flux de travail ProAgent

Lors du traitement des données du secteur d'activité 2C, ControlAgent peut déterminer le type du secteur d'activité actuel en fonction de la description du secteur d'activité et choisir d'utiliser l'outil Slack pour communication. Lors du traitement des données du secteur d'activité 2B, DataAgent peut rédiger un e-mail et l'envoyer à la boîte aux lettres du responsable correspondant

Résumé

Cette recherche propose un nouveau paradigme d'automatisation - l'automatisation des processus agentiques, adapté à l'ère du modèle à grande échelle. Par rapport à la technologie traditionnelle d'automatisation des processus robotiques, Agentic Process Automation peut automatiser la construction de flux de travail et réaliser l'automatisation des décisions dynamiques pendant l'exécution du flux de travail. La recherche a également permis de développer ProAgent et de démontrer expérimentalement la faisabilité et le potentiel des agents à grande échelle en matière d'automatisation. Je crois qu'à l'avenir, la technologie des agents à grand modèle aidera les humains à atteindre un niveau d'automatisation plus élevé et à se libérer du travail pénible

Recherches connexes menées par l'équipe

Actuellement, l'équipe de recherche a mené de nombreuses études dans le domaine direction d'agents de grands modèles. Comprend :

XAgent : un cadre d'application d'agent de modèle super puissant qui peut démonter lui-même des tâches complexes et les exécuter efficacement.
Adresse du projet : https://github.com/OpenBMB/XAgent
ChatDev : un framework de développement collaboratif multi-agent qui permet à plusieurs agents ayant des rôles différents de collaborer et de développer automatiquement des applications logicielles.
Adresse du projet : https://github.com/OpenBMB/ChatDev
AgentVerse : Une grande plate-forme générale basée sur des modèles pour les agents, recrutant une variété d'experts en agents pour aider conjointement les utilisateurs à résoudre des tâches complexes.
Adresse du projet : https://github.com/OpenBMB/AgentVerse

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

1 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Où trouver la courte de la grue à atomide atomique

1 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7444

Tutoriel CakePHP

1371

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Utilisez ddrescue pour récupérer des données sous Linux Mar 20, 2024 pm 01:37 PM

DDREASE est un outil permettant de récupérer des données à partir de périphériques de fichiers ou de blocs tels que des disques durs, des SSD, des disques RAM, des CD, des DVD et des périphériques de stockage USB. Il copie les données d'un périphérique bloc à un autre, laissant derrière lui les blocs corrompus et ne déplaçant que les bons blocs. ddreasue est un puissant outil de récupération entièrement automatisé car il ne nécessite aucune interruption pendant les opérations de récupération. De plus, grâce au fichier map ddasue, il peut être arrêté et repris à tout moment. Les autres fonctionnalités clés de DDREASE sont les suivantes : Il n'écrase pas les données récupérées mais comble les lacunes en cas de récupération itérative. Cependant, il peut être tronqué si l'outil est invité à le faire explicitement. Récupérer les données de plusieurs fichiers ou blocs en un seul

Open source! Au-delà de ZoeDepth ! DepthFM : estimation rapide et précise de la profondeur monoculaire ! Apr 03, 2024 pm 12:04 PM

0. À quoi sert cet article ? Nous proposons DepthFM : un modèle d'estimation de profondeur monoculaire génératif de pointe, polyvalent et rapide. En plus des tâches traditionnelles d'estimation de la profondeur, DepthFM démontre également des capacités de pointe dans les tâches en aval telles que l'inpainting en profondeur. DepthFM est efficace et peut synthétiser des cartes de profondeur en quelques étapes d'inférence. Lisons ce travail ensemble ~ 1. Titre des informations sur l'article : DepthFM : FastMonocularDepthEstimationwithFlowMatching Auteur : MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Bonjour, Atlas électrique ! Le robot Boston Dynamics revient à la vie, des mouvements étranges à 180 degrés effraient Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas entre officiellement dans l’ère des robots électriques ! Hier, l'Atlas hydraulique s'est retiré "en larmes" de la scène de l'histoire. Aujourd'hui, Boston Dynamics a annoncé que l'Atlas électrique était au travail. Il semble que dans le domaine des robots humanoïdes commerciaux, Boston Dynamics soit déterminé à concurrencer Tesla. Après la sortie de la nouvelle vidéo, elle a déjà été visionnée par plus d’un million de personnes en seulement dix heures. Les personnes âgées partent et de nouveaux rôles apparaissent. C'est une nécessité historique. Il ne fait aucun doute que cette année est l’année explosive des robots humanoïdes. Les internautes ont commenté : Les progrès des robots ont fait ressembler la cérémonie d'ouverture de cette année à des êtres humains, et le degré de liberté est bien plus grand que celui des humains. Mais n'est-ce vraiment pas un film d'horreur ? Au début de la vidéo, Atlas est allongé calmement sur le sol, apparemment sur le dos. Ce qui suit est à couper le souffle

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

Vitesse Internet lente des données cellulaires sur iPhone : correctifs May 03, 2024 pm 09:01 PM

Vous êtes confronté à un décalage et à une connexion de données mobile lente sur iPhone ? En règle générale, la puissance de l'Internet cellulaire sur votre téléphone dépend de plusieurs facteurs tels que la région, le type de réseau cellulaire, le type d'itinérance, etc. Vous pouvez prendre certaines mesures pour obtenir une connexion Internet cellulaire plus rapide et plus fiable. Correctif 1 – Forcer le redémarrage de l'iPhone Parfois, le redémarrage forcé de votre appareil réinitialise simplement beaucoup de choses, y compris la connexion cellulaire. Étape 1 – Appuyez simplement une fois sur la touche d’augmentation du volume et relâchez-la. Ensuite, appuyez sur la touche de réduction du volume et relâchez-la à nouveau. Étape 2 – La partie suivante du processus consiste à maintenir le bouton sur le côté droit. Laissez l'iPhone finir de redémarrer. Activez les données cellulaires et vérifiez la vitesse du réseau. Vérifiez à nouveau Correctif 2 – Changer le mode de données Bien que la 5G offre de meilleures vitesses de réseau, elle fonctionne mieux lorsque le signal est plus faible

La vitalité de la super intelligence s'éveille ! Mais avec l'arrivée de l'IA qui se met à jour automatiquement, les mères n'ont plus à se soucier des goulots d'étranglement des données. Apr 29, 2024 pm 06:55 PM

Je pleure à mort. Le monde construit à la folie de grands modèles. Les données sur Internet ne suffisent pas du tout. Le modèle de formation ressemble à « The Hunger Games », et les chercheurs en IA du monde entier se demandent comment nourrir ces personnes avides de données. Ce problème est particulièrement important dans les tâches multimodales. À une époque où rien ne pouvait être fait, une équipe de start-up du département de l'Université Renmin de Chine a utilisé son propre nouveau modèle pour devenir la première en Chine à faire de « l'auto-alimentation des données générées par le modèle » une réalité. De plus, il s’agit d’une approche à deux volets, du côté compréhension et du côté génération, les deux côtés peuvent générer de nouvelles données multimodales de haute qualité et fournir un retour de données au modèle lui-même. Qu'est-ce qu'un modèle ? Awaker 1.0, un grand modèle multimodal qui vient d'apparaître sur le Forum Zhongguancun. Qui est l'équipe ? Moteur Sophon. Fondé par Gao Yizhao, doctorant à la Hillhouse School of Artificial Intelligence de l’Université Renmin.

L'US Air Force présente son premier avion de combat IA de grande envergure ! Le ministre a personnellement effectué l'essai routier sans intervenir pendant tout le processus, et 100 000 lignes de code ont été testées 21 fois. May 07, 2024 pm 05:00 PM

Récemment, le milieu militaire a été submergé par la nouvelle : les avions de combat militaires américains peuvent désormais mener des combats aériens entièrement automatiques grâce à l'IA. Oui, tout récemment, l’avion de combat IA de l’armée américaine a été rendu public pour la première fois, dévoilant ainsi son mystère. Le nom complet de ce chasseur est Variable Stability Simulator Test Aircraft (VISTA). Il a été personnellement piloté par le secrétaire de l'US Air Force pour simuler une bataille aérienne en tête-à-tête. Le 2 mai, le secrétaire de l'US Air Force, Frank Kendall, a décollé à bord d'un X-62AVISTA à la base aérienne d'Edwards. Notez que pendant le vol d'une heure, toutes les actions de vol ont été effectuées de manière autonome par l'IA ! Kendall a déclaré : "Au cours des dernières décennies, nous avons réfléchi au potentiel illimité du combat air-air autonome, mais cela a toujours semblé hors de portée." Mais maintenant,

La version Kuaishou de Sora 'Ke Ling' est ouverte aux tests : génère plus de 120 s de vidéo, comprend mieux la physique et peut modéliser avec précision des mouvements complexes Jun 11, 2024 am 09:51 AM

Quoi? Zootopie est-elle concrétisée par l’IA domestique ? Avec la vidéo est exposé un nouveau modèle de génération vidéo domestique à grande échelle appelé « Keling ». Sora utilise une voie technique similaire et combine un certain nombre d'innovations technologiques auto-développées pour produire des vidéos qui comportent non seulement des mouvements larges et raisonnables, mais qui simulent également les caractéristiques du monde physique et possèdent de fortes capacités de combinaison conceptuelle et d'imagination. Selon les données, Keling prend en charge la génération de vidéos ultra-longues allant jusqu'à 2 minutes à 30 ips, avec des résolutions allant jusqu'à 1080p, et prend en charge plusieurs formats d'image. Un autre point important est que Keling n'est pas une démo ou une démonstration de résultats vidéo publiée par le laboratoire, mais une application au niveau produit lancée par Kuaishou, un acteur leader dans le domaine de la vidéo courte. De plus, l'objectif principal est d'être pragmatique, de ne pas faire de chèques en blanc et de se mettre en ligne dès sa sortie. Le grand modèle de Ke Ling est déjà sorti à Kuaiying.

See all articles