Table des matières
Une interface universelle pour plusieurs tâches visuelles
Maison Périphériques technologiques IA Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Oct 19, 2023 am 11:13 AM
ai 模型

GPT-4V pour la détection de cibles ? Test réel par les internautes : pas encore prêt.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Bien que les catégories détectées soient correctes, la plupart des cadres de délimitation sont mal placés.

Ce n’est pas grave, quelqu’un passera à l’action !

Le Mini GPT-4 qui a battu le GPT-4 de plusieurs mois en termes de capacité de visualisation d'images a été mis à niveau - MiniGPT-v2.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

△ (GPT-4V est généré à gauche et MiniGPT-v2 est généré à droite)

Et c'est juste une simple commande : [grounding] décrivez cette image en détail pour obtenir le résultat.

Non seulement cela, il peut également gérer facilement diverses tâches visuelles.

Entourez un objet et ajoutez [identifier] devant le mot d'invite pour permettre au modèle d'identifier directement le nom de l'objet.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Bien sûr, vous pouvez également ne rien ajouter et simplement demander ~

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

MiniGPT-v2 est composé de l'équipe originale de MiniGPT-4 (Université des sciences et technologies KAUST King Abdullah en Arabie Saoudite) et de cinq chercheurs du développement conjoint Meta.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

La dernière fois, MiniGPT-4 a attiré une énorme attention lors de sa sortie, et le serveur a été submergé pendant un moment. Aujourd'hui, le projet GitHub dépasse les 22 000 étoiles.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Avec cette mise à niveau, certains internautes ont déjà commencé à l'utiliser~

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Une interface universelle pour plusieurs tâches visuelles

En tant qu'interface universelle pour diverses applications de texte, tout le monde s'y est habitué. S'inspirant de cela, l'équipe de recherche souhaite créer une interface unifiée pouvant être utilisée pour diverses tâches visuelles, telles que la description d'images, la réponse visuelle à des questions, etc.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

"Comment utiliser des instructions multimodales simples pour effectuer efficacement diverses tâches sous la condition d'un seul modèle ?" est devenu un problème que l'équipe doit résoudre.

Pour faire simple, MiniGPT-v2 se compose de trois parties : le squelette visuel, la couche linéaire et le grand modèle de langage.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Le modèle est basé sur l'épine dorsale visuelle ViT et reste inchangé à toutes les étapes de formation. Quatre jetons de sortie visuelle adjacents sont induits à partir de ViT et projetés dans l'espace de modèle de langage LLaMA-2 à travers des couches linéaires.

L'équipe recommande d'utiliser des identifiants uniques pour différentes tâches dans le modèle de formation, afin que les grands modèles puissent facilement distinguer chaque instruction de tâche et améliorer l'efficacité d'apprentissage de chaque tâche.

La formation est principalement divisée en trois étapes : pré-formation - formation multi-tâches - ajustement des instructions multi-modes.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

En fin de compte, MiniGPT-v2 a surpassé les autres modèles généraux de langage visuel dans de nombreux tests de réponse visuelle aux questions et de référence visuelle.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

En fin de compte, ce modèle peut effectuer une variété de tâches visuelles, telles que la description de l'objet cible, la localisation visuelle, la description de l'image, la réponse visuelle aux questions et l'analyse directe des objets image à partir d'un texte d'entrée donné.

Les capacités visuelles du très populaire mini GPT-4 ont grimpé en flèche, avec 20 000 étoiles sur GitHub, produites par une équipe chinoise

Les amis intéressés peuvent cliquer sur le lien Démo ci-dessous pour en faire l'expérience :

https://minigpt-v2.github.io/
https://huggingface.co/spaces/Vision-CAIR/ MiniGPT -v2

Lien papier : https://arxiv.org/abs/2310.09478

Lien GitHub : https://github.com/Vision-CAIR/MiniGPT-4

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

WEB3 Trading Platform Ranking_Web3 Global Exchanges Top Ten Résumé WEB3 Trading Platform Ranking_Web3 Global Exchanges Top Ten Résumé Apr 21, 2025 am 10:45 AM

Binance est le suzerain de l'écosystème mondial de trading d'actifs numériques, et ses caractéristiques comprennent: 1. Le volume de négociation quotidien moyen dépasse 150 milliards de dollars, prend en charge 500 paires de négociation, couvrant 98% des monnaies grand public; 2. La matrice d'innovation couvre le marché des dérivés, la mise en page Web3 et le système éducatif; 3. Les avantages techniques sont des moteurs de correspondance d'une milliseconde, avec des volumes de traitement de pointe de 1,4 million de transactions par seconde; 4. Conformité Progress détient des licences de 15 pays et établit des entités conformes en Europe et aux États-Unis.

Top 10 plates-formes d'échange de crypto-monnaie La plus grande liste de changes numériques au monde Top 10 plates-formes d'échange de crypto-monnaie La plus grande liste de changes numériques au monde Apr 21, 2025 pm 07:15 PM

Les échanges jouent un rôle essentiel sur le marché des crypto-monnaies d'aujourd'hui. Ce ne sont pas seulement des plateformes pour les investisseurs pour négocier, mais aussi des sources importantes de liquidité du marché et la découverte des prix. Les plus grands échanges de devises virtuels au monde se classent parmi les dix premiers, et ces échanges sont non seulement bien en avance dans le volume des échanges, mais présentent également leurs propres avantages dans l'expérience utilisateur, la sécurité et les services innovants. Les échanges qui dépassent la liste ont généralement une grande base d'utilisateurs et une influence approfondie du marché, et leur volume de trading et leurs types d'actifs sont souvent difficiles à atteindre par d'autres échanges.

Comment éviter les pertes après la mise à niveau de l'ETH Comment éviter les pertes après la mise à niveau de l'ETH Apr 21, 2025 am 10:03 AM

Après la mise à niveau de l'ETH, les novices devraient adopter les stratégies suivantes pour éviter les pertes: 1. Faites leurs devoirs et comprenez les connaissances de base et la mise à niveau du contenu de l'ETH; 2. Contrôler les positions, tester les eaux en petites quantités et diversifier l'investissement; 3. Faire un plan de négociation, clarifier les objectifs et fixer des points de perte d'arrêt; 4. Profilement rationnellement et éviter la prise de décision émotionnelle; 5. Choisissez une plate-forme de trading formelle et fiable; 6. Considérons la tenue à long terme pour éviter l'impact des fluctuations à court terme.

Que signifie la transaction transversale? Quelles sont les transactions transversales? Que signifie la transaction transversale? Quelles sont les transactions transversales? Apr 21, 2025 pm 11:39 PM

Échanges qui prennent en charge les transactions transversales: 1. Binance, 2. UniSwap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN Trade, ces plateformes prennent en charge les transactions d'actifs multi-chaînes via diverses technologies.

Quelles sont les dix principales plates-formes du cercle d'échange de devises? Quelles sont les dix principales plates-formes du cercle d'échange de devises? Apr 21, 2025 pm 12:21 PM

Les principaux échanges comprennent: 1. Binance, le plus grand volume de trading au monde, prend en charge 600 devises et les frais de gestion des points sont de 0,1%; 2. Okx, une plate-forme équilibrée, prend en charge 708 paires de trading, et les frais de traitement des contrats perpétuels sont de 0,05%; 3. Gate.io, couvre 2700 petites monnaies, et les frais de traitement des points sont de 0,1% à 0,3%; 4. Coinbase, la référence de conformité américaine, les frais de traitement des points sont de 0,5%; 5. Kraken, la haute sécurité et l'audit de réserve régulière.

Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Apr 21, 2025 am 08:57 AM

Les facteurs de la hausse des prix des devises virtuels comprennent: 1. Une augmentation de la demande du marché, 2. Daisser l'offre, 3. Stimulé de nouvelles positives, 4. Sentiment du marché optimiste, 5. Environnement macroéconomique; Les facteurs de déclin comprennent: 1. Daissement de la demande du marché, 2. AUGMENT DE L'OFFICATION, 3. Strike of Negative News, 4. Pespimiste Market Sentiment, 5. Environnement macroéconomique.

Prévisions des prix WorldCoin (WLD) 2025-2031: WLD atteindra-t-il 4 $ d'ici 2031? Prévisions des prix WorldCoin (WLD) 2025-2031: WLD atteindra-t-il 4 $ d'ici 2031? Apr 21, 2025 pm 02:42 PM

WorldCoin (WLD) se démarque sur le marché des crypto-monnaies avec ses mécanismes uniques de vérification biométrique et de protection de la vie privée, attirant l'attention de nombreux investisseurs. WLD a permis de se produire avec remarquablement parmi les Altcoins avec ses technologies innovantes, en particulier en combinaison avec la technologie d'Intelligence artificielle OpenAI. Mais comment les actifs numériques se comporteront-ils au cours des prochaines années? Prédons ensemble le prix futur de WLD. Les prévisions de prix de 2025 WLD devraient atteindre une croissance significative de la WLD en 2025. L'analyse du marché montre que le prix moyen du WLD peut atteindre 1,31 $, avec un maximum de 1,36 $. Cependant, sur un marché baissier, le prix peut tomber à environ 0,55 $. Cette attente de croissance est principalement due à WorldCoin2.

'Black Monday Sell' est une journée difficile pour l'industrie de la crypto-monnaie 'Black Monday Sell' est une journée difficile pour l'industrie de la crypto-monnaie Apr 21, 2025 pm 02:48 PM

Le plongeon sur le marché des crypto-monnaies a provoqué la panique parmi les investisseurs, et Dogecoin (Doge) est devenu l'une des zones les plus difficiles. Son prix a fortement chuté et le verrouillage de la valeur totale de la finance décentralisée (DEFI) (TVL) a également connu une baisse significative. La vague de vente de "Black Monday" a balayé le marché des crypto-monnaies, et Dogecoin a été le premier à être touché. Son Defitvl a chuté aux niveaux de 2023 et le prix de la devise a chuté de 23,78% au cours du dernier mois. Le Defitvl de Dogecoin est tombé à un minimum de 2,72 millions de dollars, principalement en raison d'une baisse de 26,37% de l'indice de valeur SOSO. D'autres plates-formes de Defi majeures, telles que le Dao et Thorchain ennuyeux, TVL ont également chuté de 24,04% et 20, respectivement.

See all articles