Capacités d'IA visuelle unifiée ! Détection et segmentation automatisées d'images, et images vincentiennes contrôlables, produites par une équipe chinoise-IA-php.cn

Table des matières

Maison

Capacités d'IA visuelle unifiée ! Détection et segmentation automatisées d'images, et images vincentiennes contrôlables, produites par une équipe chinoise

王林

Apr 12, 2023 pm 05:31 PM

ai 模型

Cet article est réimprimé avec l'autorisation d'AI New Media Qubit (ID de compte public : QbitAI). Veuillez contacter la source pour la réimpression.

Il est maintenant vraiment temps de rivaliser avec la vitesse des mains dans le cercle de l'IA.

Non, le SAM de Meta vient d'être lancé il y a quelques jours, et les programmeurs nationaux sont venus superposer les buffs, intégrant en un seul détection de cible, segmentation et génération de fonctions majeures d'IA visuelle !

Par exemple, grâce à Stable Diffusion et SAM, vous pouvez facilement remplacer la chaise sur la photo par un canapé :

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

Changer de vêtements et de couleur de cheveux est également très simple :

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

Dès que le projet est lancé est sorti, beaucoup de gens se sont exclamés : La vitesse de la main est trop rapide !

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

Quelqu'un d'autre a dit : Il y a de nouvelles photos de mariage de Yui Aragaki et moi.

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

Ce qui précède est l'effet apporté par Gounded-SAM Le projet a reçu 1,8k étoiles sur GitHub.

En termes simples, il s'agit d'une application de vision zéro qui n'a besoin que de saisir des images pour détecter et segmenter automatiquement les images.

Cette recherche provient de l'IDEA Research Institute (Institut de recherche sur l'économie numérique de la région de la Grande Baie de Guangdong-Hong Kong-Macao), dont le fondateur et président est Shen Xiangyang.

Aucune formation supplémentaire requise

Grounded SAM se compose principalement de deux modèles : Grounding DINO et SAM.

Parmi eux, SAM (Segment Anything) est un modèle de segmentation à échantillon zéro qui vient d'être lancé par Meta il y a 4 jours.

Il peut générer des masques pour tous les objets dans les images/vidéos, y compris les objets et les images qui ne sont pas apparus pendant le processus de formation.

En laissant SAM renvoyer un masque valide pour n'importe quelle invite, le modèle peut générer un masque raisonnable parmi toutes les possibilités, même si l'invite est ambiguë ou pointe vers plusieurs objets. Cette tâche est utilisée pour pré-entraîner le modèle et résoudre les tâches générales de segmentation en aval via des astuces.

Le cadre du modèle se compose principalement d'un encodeur d'image, d'un encodeur d'indices et d'un décodeur de masque rapide. Après avoir calculé l'intégration de l'image, SAM est capable de générer une segmentation basée sur n'importe quelle invite du Web en 50 millisecondes.

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

Grounding DINO est une réalisation existante de cette équipe de recherche.

Il s'agit d'un modèle de détection zéro tir, qui peut générer des boîtes d'objets et des étiquettes avec des descriptions textuelles.

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

Après avoir combiné les deux, vous pouvez trouver n'importe quel objet dans l'image via une description textuelle, puis utiliser les puissantes capacités de segmentation de SAM pour segmenter le masque de manière fine

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

En plus de ces capacités. , ils superposent également la capacité de diffusion stable, qui est la génération d'images contrôlables présentée au début.

Il convient de mentionner que Stable Diffusion était capable d'atteindre des fonctions similaires auparavant. Effacez simplement les éléments de l’image que vous souhaitez remplacer et entrez l’invite de texte.

Cette fois, Grounded SAM peut enregistrer l'étape de sélection manuelle et la contrôler directement via une description textuelle.

De plus, combiné au BLIP (Bootstrapping Language-Image Pre-training), il génère des titres d'images, extrait des étiquettes, puis génère des boîtes d'objets et des masques.

Actuellement, des fonctionnalités plus intéressantes sont en cours de développement.

Par exemple, quelques extensions de personnages : changement de vêtements, couleur de cheveux, couleur de peau, etc.

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

La méthode de consommation spécifique a également été donnée sur GitHub. Le projet nécessite Python 3.8 ou supérieur, pytorch 1.7 ou supérieur, torchvision 0.8 ou supérieur, et les dépendances associées doivent être installées. Pour un contenu spécifique, veuillez consulter la page du projet GitHub.

L'équipe de recherche est issue de l'IDEA Research Institute (Institut de recherche sur l'économie numérique de la région de la Grande Baie de Guangdong-Hong Kong-Macao).

Les informations publiques montrent que l'institut est une institution internationale de recherche innovante dans le domaine de l'intelligence artificielle, de l'industrie de l'économie numérique et des technologies de pointe. L'ancien scientifique en chef du Microsoft Asia Research Institute et ancien vice-président de Microsoft Global Intelligence Dr Shen Xiangyang. est le fondateur et le président.

One More Thing

Pour les travaux futurs de Grounded SAM, l'équipe a plusieurs perspectives :

Générer automatiquement des images pour former un nouvel ensemble de données
Modèle de base puissant avec pré-formation à la segmentation
Coopérer avec (Chat- )GPT
Constituez un pipeline qui génère automatiquement des étiquettes, des boîtes et des masques d'image, et peut générer de nouvelles images.

Il convient de mentionner que de nombreux membres de l'équipe de ce projet sont des répondants actifs dans le domaine de l'IA sur Zhihu. Cette fois, ils ont également répondu aux questions sur Grounded SAM sur les chaussures pour enfants intéressés. Vous pouvez laisser un message pour obtenir des conseils ~.

Capacités dIA visuelle unifiée ! Détection et segmentation automatisées dimages, et images vincentiennes contrôlables, produites par une équipe chinoise

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Commandes de chat et comment les utiliser

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7532

Tutoriel CakePHP

1379

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Conseils de configuration du pare-feu Debian Mail Server Apr 13, 2025 am 11:42 AM

La configuration du pare-feu d'un serveur de courrier Debian est une étape importante pour assurer la sécurité du serveur. Voici plusieurs méthodes de configuration de pare-feu couramment utilisées, y compris l'utilisation d'iptables et de pare-feu. Utilisez les iptables pour configurer le pare-feu pour installer iptables (sinon déjà installé): Sudoapt-getUpDaSuDoapt-getinstalliptableView Règles actuelles iptables: Sudoiptable-L Configuration

Comment Debian Readdir s'intègre à d'autres outils Apr 13, 2025 am 09:42 AM

La fonction ReadDir dans le système Debian est un appel système utilisé pour lire le contenu des répertoires et est souvent utilisé dans la programmation C. Cet article expliquera comment intégrer ReadDir avec d'autres outils pour améliorer sa fonctionnalité. Méthode 1: combinant d'abord le programme de langue C et le pipeline, écrivez un programme C pour appeler la fonction readdir et sortir le résultat: # include # include # include # includeIntmain (intargc, char * argv []) {dir * dir; structDirent * entrée; if (argc! = 2) {

Comment définir le niveau de journal Debian Apache Apr 13, 2025 am 08:33 AM

Cet article décrit comment ajuster le niveau de journalisation du serveur Apacheweb dans le système Debian. En modifiant le fichier de configuration, vous pouvez contrôler le niveau verbeux des informations de journal enregistrées par Apache. Méthode 1: Modifiez le fichier de configuration principal pour localiser le fichier de configuration: le fichier de configuration d'Apache2.x est généralement situé dans le répertoire / etc / apache2 /. Le nom de fichier peut être apache2.conf ou httpd.conf, selon votre méthode d'installation. Modifier le fichier de configuration: Ouvrez le fichier de configuration avec les autorisations racine à l'aide d'un éditeur de texte (comme Nano): Sutonano / etc / apache2 / apache2.conf

Comment optimiser les performances de Debian Readdir Apr 13, 2025 am 08:48 AM

Dans Debian Systems, les appels du système ReadDir sont utilisés pour lire le contenu des répertoires. Si ses performances ne sont pas bonnes, essayez la stratégie d'optimisation suivante: simplifiez le nombre de fichiers d'annuaire: divisez les grands répertoires en plusieurs petits répertoires autant que possible, en réduisant le nombre d'éléments traités par appel ReadDir. Activer la mise en cache de contenu du répertoire: construire un mécanisme de cache, mettre à jour le cache régulièrement ou lorsque le contenu du répertoire change et réduire les appels fréquents à Readdir. Les caches de mémoire (telles que Memcached ou Redis) ou les caches locales (telles que les fichiers ou les bases de données) peuvent être prises en compte. Adoptez une structure de données efficace: si vous implémentez vous-même la traversée du répertoire, sélectionnez des structures de données plus efficaces (telles que les tables de hachage au lieu de la recherche linéaire) pour stocker et accéder aux informations du répertoire

Comment implémenter le tri des fichiers par Debian Readdir Apr 13, 2025 am 09:06 AM

Dans Debian Systems, la fonction ReadDir est utilisée pour lire le contenu du répertoire, mais l'ordre dans lequel il revient n'est pas prédéfini. Pour trier les fichiers dans un répertoire, vous devez d'abord lire tous les fichiers, puis les trier à l'aide de la fonction QSORT. Le code suivant montre comment trier les fichiers de répertoire à l'aide de ReadDir et QSort dans Debian System: # include # include # include # include # include // Fonction de comparaison personnalisée, utilisée pour qsortintCompare (constvoid * a, constvoid * b) {returnstrcmp (* (

Méthode d'installation du certificat de Debian Mail Server SSL Apr 13, 2025 am 11:39 AM

Les étapes pour installer un certificat SSL sur le serveur de messagerie Debian sont les suivantes: 1. Installez d'abord la boîte à outils OpenSSL, assurez-vous que la boîte à outils OpenSSL est déjà installée sur votre système. Si ce n'est pas installé, vous pouvez utiliser la commande suivante pour installer: Sudoapt-getUpDaSuDoapt-getInstallOpenSSL2. Générer la clé privée et la demande de certificat Suivant, utilisez OpenSSL pour générer une clé privée RSA 2048 bits et une demande de certificat (RSE): OpenSS

Comment effectuer une vérification de la signature numérique avec Debian OpenSSL Apr 13, 2025 am 11:09 AM

En utilisant OpenSSL pour la vérification de la signature numérique sur Debian System, vous pouvez suivre ces étapes: Préparation à installer OpenSSL: Assurez-vous que votre système Debian a installé OpenSSL. Si vous n'êtes pas installé, vous pouvez utiliser la commande suivante pour l'installer: SudoaptupDaSudoaptinInStallOpenssl pour obtenir la clé publique: la vérification de la signature numérique nécessite la clé publique du signataire. En règle générale, la clé publique sera fournie sous la forme d'un fichier, comme public_key.pe

Comment Debian OpenSSL empêche les attaques de l'homme au milieu Apr 13, 2025 am 10:30 AM

Dans Debian Systems, OpenSSL est une bibliothèque importante pour le chiffrement, le décryptage et la gestion des certificats. Pour empêcher une attaque d'homme dans le milieu (MITM), les mesures suivantes peuvent être prises: utilisez HTTPS: assurez-vous que toutes les demandes de réseau utilisent le protocole HTTPS au lieu de HTTP. HTTPS utilise TLS (Protocole de sécurité de la couche de transport) pour chiffrer les données de communication pour garantir que les données ne sont pas volées ou falsifiées pendant la transmission. Vérifiez le certificat de serveur: vérifiez manuellement le certificat de serveur sur le client pour vous assurer qu'il est digne de confiance. Le serveur peut être vérifié manuellement via la méthode du délégué d'URLSession

See all articles