localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- Doubao Big Model Team publie un nouveau benchmark d'évaluation des légendes d'images détaillées pour améliorer la fiabilité de l'évaluation des légendes VLM
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Le modèle de langage visuel (VLM) actuel effectue principalement une évaluation des performances via un format de questions et réponses d'assurance qualité, mais manque d'évaluation de la compréhension de base du modèle, telle que des méthodes d'évaluation fiables pour performances de la légende de l'image détaillée. En réponse à ce problème, l'Académie chinoise des sciences,
- IA 927 2024-07-18 20:10:02
-
- Les nouveaux produits de la série Samsung China Galaxy Z accèdent au pouf grand modèle
- Le 17 juillet, Samsung Electronics a lancé une nouvelle génération de produits de la série Galaxy Z pour le marché chinois. Lors de la réunion, Samsung Electronics et Volcano Engine ont officiellement annoncé leur coopération pour connecter les modèles de poufs aux assistants intelligents et à la vision IA des téléphones mobiles Galaxy Z Fold6 et Galaxy Z Flip 6 afin d'améliorer l'expérience des applications intelligentes des téléphones mobiles. Auparavant, Samsung avait annoncé sa coopération approfondie avec Google Gemini lors du lancement de nouveaux produits à l'étranger. En Chine, il avait sélectionné des fabricants tels que Volcano Engine comme grands partenaires modèles. légende fenye : L'assistant intelligent et le modèle de pouf à accès visuel IA des téléphones mobiles Samsung Galaxy Z Fold6 et Galaxy Z Flip 6 En plus des fonctions IA qui ont été divulguées telles que la recherche en cercle, la traduction en temps réel, l'enregistrement de la transcription. , etc., cette fois
- IA 646 2024-07-18 20:07:33
-
- Abandonnant l'encodeur visuel, ce grand modèle multimodal « version native » est également comparable aux méthodes traditionnelles
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Diao Haiwen est doctorant à l'Université de technologie de Dalian et son superviseur est le professeur Lu Huchuan. Actuellement en stage à l'Institut de recherche sur l'intelligence artificielle Zhiyuan de Pékin, l'instructeur est le Dr Wang Xinlong. Ses intérêts de recherche sont la vision et le langage, le transfert efficace de grands modèles, les grands modèles multimodaux, etc. Faisons Cui ensemble
- IA 423 2024-07-18 19:21:11
-
- Tous ces VLM sont-ils aveugles ? GPT-4o et Sonnet-3.5 ont successivement échoué au test de « vision »
- Les quatre principaux VLM tentent tous de tromper les aveugles ? Laissez les modèles SOTA les plus populaires (GPT-4o, Gemini-1.5, Sonnet-3, Sonnet-3.5) compter le nombre d'intersections entre deux lignes. Seront-ils plus performants que les humains ? La réponse est probablement non. Depuis le lancement de GPT-4V, les modèles de langage visuel (VLM) ont permis à l'intelligence des grands modèles de faire un grand pas de plus vers le niveau d'intelligence artificielle que nous imaginions. Les VLM peuvent à la fois comprendre les images et utiliser un langage pour décrire ce qu'ils voient, et effectuer des tâches complexes basées sur ces compréhensions. Par exemple, si vous envoyez au modèle VLM une photo d'une table à manger et une photo d'un menu, il peut extraire le nombre de bouteilles de bière et le prix unitaire du menu à partir des deux images, et calculer
- IA 690 2024-07-18 18:18:02
-
- MotionClone : Aucune formation requise, clonage en un clic des mouvements vidéo
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Aucune formation ou réglage fin n'est requis. Le mouvement de la vidéo de référence peut être cloné dans la nouvelle scène spécifiée par le mot d'invite. mouvement du corps, cela peut être fait en un seul clic. Article : https://arxiv.org/abs/2406.05
- IA 1045 2024-07-18 17:06:12
-
- Une nouvelle piste pour que les humains imitent l'IA, AI : Quand il s'agit de folie, tu es mon père
- Rédacteur du rapport sur le pouvoir des machines : l’IA de Yang Wen a été égarée par les humains ! Ce monde est tellement fou... Récemment, un tas de vidéos amusantes sont apparues sur les réseaux sociaux, sous la bannière de l'IA, de vraies personnes cosplayant avec l'IA, et Douyin a même un sujet brûlant : le concours d'imitation humaine de l'IA. (La vidéo vient du blogueur Douyin "Guan Ni Luan Shi") Lien vidéo : https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlwLes routines sont toutes les mêmes : une vieille photo à gauche, et "AI Repair" À droite, sous-titres, le « complot » sanglant des troncs cérébraux manquants est en réalité réalisé par de vraies personnes. -1-AI : C'est la première fois qu'on me fait passer pour, mais je ne m'attendais pas à ce que ce soit pire que le mien.
- IA 1788 2024-07-18 16:51:08
-
- L'efficacité d'inférence des grands modèles a été multipliée par 3 sans perte. L'Université de Waterloo, l'Université de Pékin et d'autres institutions ont publié EAGLE.
- Les grands modèles de langage (LLM) sont de plus en plus utilisés dans divers domaines. Cependant, leur processus de génération de texte est coûteux et lent. Cette inefficacité est attribuée aux règles de fonctionnement du décodage autorégressif : la génération de chaque mot (token) nécessite une propagation vers l'avant, nécessitant l'accès à un LLM de milliards à centaines de milliards de paramètres. Cela se traduit par un décodage autorégressif traditionnel plus lent. Récemment, l'Université de Waterloo, le Canadian Vector Institute, l'Université de Pékin et d'autres institutions ont publié conjointement EAGLE, qui vise à améliorer la vitesse d'inférence des grands modèles de langage tout en assurant une distribution cohérente du texte de sortie du modèle. Cette méthode extrapole le deuxième vecteur de fonctionnalités de haut niveau de LLM, ce qui peut améliorer considérablement l'efficacité de la génération. Rapport technique : https://sites.google.com/view
- IA 1044 2024-07-18 14:43:48
-
- Pour évaluer efficacement les performances réelles de l'Agent, le nouveau cadre d'évaluation en ligne WebCanvas est ici
- Pan Yichen : étudiant en première année de master à l’Université du Zhejiang. Kong Dehan : responsable de l'algorithme de modèle chez Cross Star Technology. Zhou Sida : Diplômé de l'Université de Nanchang en 2024, il étudiera pour une maîtrise à l'Université des sciences et technologies électroniques de Xi'an. Cui Cheng : diplômé en 2024 de l'Université de médecine traditionnelle chinoise du Zhejiang et étudiera pour une maîtrise à l'Université de Suzhou. Pan Yichen, Zhou Sida et Cui Cheng ont réalisé conjointement les travaux de recherche de cet article en tant que stagiaires en algorithme chez Cross Star Technology. À l'ère actuelle de développement technologique rapide, le Large Language Model (LLM) change la façon dont nous interagissons avec le monde numérique à une vitesse sans précédent. Les agents intelligents basés sur LLM (LLMAgent) sont progressivement intégrés, depuis la simple recherche d'informations jusqu'aux opérations complexes sur les pages Web.
- IA 636 2024-07-18 14:04:51
-
- AKOOL soutient les Cannes Advertising Awards et lance une plateforme humaine numérique révolutionnaire en temps réel
- Alors que la Coupe d’Europe 2024 bat son plein, une vidéo d’un match de football réalisée par l’entreprise française de télécommunications Orange est également rapidement devenue populaire. Dans la vidéo, on a vu Mbappé, Giroud, Griezmann... En fait, tous les athlètes qui courent sur le terrain ne sont pas de vraies personnes, mais des personnages virtuels générés par l'intelligence artificielle. Grâce à sa créativité exceptionnelle et à son caractère unique, l'œuvre a remporté l'« Oscar » dans l'industrie du marketing créatif publicitaire - le prix de la catégorie sport au Festival international de la créativité Cannes Lions de cette année. AKOOL a fourni un support technique de base pour ce travail primé. Le système de capture faciale IA qu'ils ont développé peut capturer avec précision les expressions et les mouvements subtils des visages humains. Avec le soutien d'une technologie de rendu soigneusement conçue, les personnages virtuels de l'œuvre.
- IA 565 2024-07-18 09:26:11
-
- 178 pages, 128 cas, évaluation complète du GPT-4V dans le domaine médical, encore loin de l'application clinique et de la prise de décision pratique
- L'Université Jiao Tong de Shanghai et l'AILab de Shanghai ont publié une étude de cas médical du GPT-4V de 178 pages, révélant pour la première fois de manière exhaustive les performances visuelles du GPT-4V dans le domaine médical. Poussé par des modèles de base à grande échelle, le développement de l'intelligence artificielle a fait de grands progrès récemment, en particulier le GPT-4 d'OpenAI. Ses puissantes capacités de questions-réponses et de connaissances ont illuminé le moment Eureka dans le domaine de l'IA, provoquant un large public. préoccupation. GPT-4V(ision) est le dernier modèle de base multimodal d'OpenAI. Par rapport à GPT-4, il ajoute des capacités de saisie d’images et de voix. Cette étude vise à évaluer les performances du GPT-4V(ision) dans le domaine du diagnostic médical multimodal à travers une analyse de cas au total 1.
- IA 1262 2024-07-18 06:20:10
-
- Appel à communications et défi lancés pour l'atelier ICML 2024 sur l'IA pour les mathématiques !
- ICML2024, atelier AIforMathWorkshop sur le raisonnement mathématique de l'IA en langage formel et naturel Heure : 26 et 27 juillet 2024 Lieu : Vienne, Autriche. Organisé simultanément sur place et en ligne. Page d'accueil de l'atelier : https://sites.google.com/view/ai4mathworkshopicml2024/ Le raisonnement mathématique est la partie la plus difficile et la plus profonde de l'intelligence humaine. Dans le processus de développement du raisonnement mathématique, les humains ont résumé divers langages formels, capables de décrire strictement des problèmes mathématiques et des processus de preuve. Ces dernières années, les algorithmes d’apprentissage automatique et les modèles de langage à grande échelle se rapprochent progressivement, voire dépassent, les performances humaines dans certains raisonnements mathématiques.
- IA 753 2024-07-18 05:36:50
-
- Meta développe la technologie de distillation System 2 et la précision des tâches du modèle de dialogue Llama 2 est proche de 100 %
- Les chercheurs ont déclaré que si la distillation du System2 pouvait devenir une caractéristique importante des futurs systèmes d’IA à apprentissage continu, elle pourrait encore améliorer les performances des tâches d’inférence là où le System2 ne fonctionne pas aussi bien. Lorsqu'il s'agit de stratégies de grands modèles de langage (LLM), il en existe généralement deux types, l'un est le Système 1 immédiat (réponse rapide) et l'autre est le Système 2 (pensée lente). Là où le raisonnement System2 favorise la pensée réfléchie, la pensée intermédiaire générative permet au modèle (ou à l'humain) de raisonner et de planifier afin de mener à bien une tâche ou de répondre aux instructions. Dans le raisonnement du Système 2, une activité mentale intense est requise, en particulier dans les situations où le Système 1 (pensée plus automatique) peut mal tourner. Par conséquent, System1 est
- IA 1175 2024-07-18 05:07:20
-
- Pour répondre directement aux besoins réels en AGI de la partie A, le Forum de développement de l'intégration de l'industrie de l'autonomisation de l'intelligence artificielle s'est tenu avec succès.
- Le 6 juillet, le « Forum de développement de l'intégration de l'industrie de l'autonomisation de l'industrie de l'autonomisation de l'intelligence artificielle WAIC 2024 » s'est tenu en grande pompe au Centre des expositions et des congrès de l'Exposition universelle. Le sujet principal de ce forum est de discuter des questions liées à l'intelligence artificielle favorisant la nouvelle industrialisation et favorisant le développement de l'intégration industrielle, y compris les discours des dirigeants, les cérémonies de signature, les discours d'ouverture, la publication des exigences des scénarios d'intelligence artificielle pour les entreprises centrales et publiques, et tables rondes. De nombreuses entreprises d'État centrales et des domaines de l'intelligence artificielle ont participé, notamment l'Institut de recherche sur le développement de l'industrie de l'information électronique de Chine, l'Institut de recherche mobile de Chine, Sinopec Shengli Oilfield, State Grid Customer Service Center, China Power Yuchuang, China Southern Power Grid Digital Grid Group, Institut Damo, Baidu Smart Cloud, Innovation Qizhi, etc. Les invités participant à la conférence se sont concentrés sur la pratique d'application de l'intelligence artificielle dans différents domaines, le développement et l'application de grands modèles, ainsi que l'exploitation et la maintenance intelligentes.
- IA 575 2024-07-18 03:14:57
-
- Comment les spécialistes du marketing AIGC à la mode peuvent - ils parvenir à une situation gagnant - gagnant entre « Lizi » et « Face » ?
- Innovation et sécurité de la technologie AIGC dans le domaine du marketing Au cours de l'année écoulée, la technologie de l'IA a déclenché une vague de changement dans tous les domaines. Le milieu du marketing, qui a toujours été « à la mode », a été le premier à adopter la technologie AIGC. Des données pertinentes montrent qu'en 2023, près de la moitié des annonceurs chinois appliqueront la technologie AIGC dans leurs activités de marketing en ligne, et plus de 90 % de ces applications se concentrent sur la création de contenu et le développement créatif. Ce nouveau modèle de publicité et de marketing axé sur la technologie prend progressivement forme, offrant aux annonceurs davantage de possibilités de réduire leurs coûts et d'accroître leur efficacité. Cependant, si la technologie AIGC est très utilisée dans le domaine du marketing, elle présente également de nombreux défis. Par exemple, la technologie AIGC peut entraîner des risques de contenu lors de la génération de supports marketing, et des activités marketing fortement investies peuvent accidentellement servir de robe de mariée à des produits illégaux. Donc,
- IA 874 2024-07-18 01:41:21
-
- ICML 2024 | Points de contrôle de dégradé trop lents ? Sans ralentir ni économiser la mémoire vidéo, LowMemoryBP améliore considérablement l'efficacité de la mémoire vidéo de rétro-propagation
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Le premier auteur de cet article est Yang Yuchen, étudiant en deuxième année de maîtrise à l'École de statistique et de science des données de l'Université de Nankai, et son conseiller est le professeur agrégé Xu Jun. à l'École de statistique et de science des données de l'Université de Nankai. Les recherches de l’équipe du professeur Xu Jun portent sur la vision par ordinateur, l’IA générative et l’apprentissage automatique efficace.
- IA 775 2024-07-18 01:39:51