localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- Conversation exclusive avec Li Yan : Financée par Suhua, Jingwei et Redpoint, la première startup de « recommandation générative » AI Pioneers |
- L’humanité inaugure une mise à jour explosive dans le domaine de l’intelligence artificielle. Presque chaque étape de l’expansion de la technologie vers l’inconnu a attiré une attention étonnante. Dans le processus de repoussement des frontières de l'intelligence artificielle, l'innovation et le désaccord cohabitent dans les parcours techniques des pistes importantes. Le jugement et les choix des pionniers de la technologie influencent les traces de nombreux adeptes. Au cours de l'année écoulée, ce site Web a pris les devants en exclusivité en présentant à tout le monde des sociétés exceptionnelles telles que Dark Side of the Moon, Shengshu Technology, Aishi Technology et Wuwen Core Dome, leur laissant avec le premier « script d'interview de 10 000 mots » en le monde Internet. À un stade où la feuille de route technique n’a pas encore convergé, nous avons vu le leadership d’entrepreneurs en IA qui ont véritablement foi, courage et cognition systématique. C’est pourquoi nous lançons « AIPioneers »
- IA 880 2024-07-19 05:03:59
-
- Travail posthume de l'équipe OpenAI Super Alignment : deux grands modèles jouent à un jeu et le résultat devient plus compréhensible
- Si la réponse donnée par le modèle d’IA est incompréhensible du tout, oseriez-vous l’utiliser ? À mesure que les systèmes d’apprentissage automatique sont utilisés dans des domaines de plus en plus importants, il devient de plus en plus important de démontrer pourquoi nous pouvons faire confiance à leurs résultats, et quand ne pas leur faire confiance. Une façon possible de gagner confiance dans le résultat d'un système complexe est d'exiger que le système produise une interprétation de son résultat qui soit lisible par un humain ou un autre système de confiance, c'est-à-dire entièrement compréhensible au point que toute erreur possible puisse être trouvé. Par exemple, pour renforcer la confiance dans le système judiciaire, nous exigeons que les tribunaux fournissent des avis écrits clairs et lisibles qui expliquent et soutiennent leurs décisions. Pour les grands modèles de langage, nous pouvons également adopter une approche similaire. Cependant, lorsque vous adoptez cette approche, assurez-vous que le modèle de langage génère
- IA 769 2024-07-19 01:29:52
-
- L'Université Tsinghua a remporté le prix du meilleur article + test de temps, l'Université du Shandong a reçu une mention honorable et les prix SIGIR 2024 ont été annoncés
- Les résultats de l’Université Tsinghua sont exceptionnels. La 47e Conférence de l'International Computer Society sur la recherche d'informations (ACMSIGIR) se tiendra à Washington, DC, États-Unis, du 14 au 18 juillet 2024. Cette conférence est la plus grande conférence académique dans le domaine de la recherche d'informations. Tout à l'heure, la conférence a annoncé le prix du meilleur article, le prix du meilleur article, le prix de la mention honorable du meilleur article et le prix Time Test. Parmi eux, l'Université Tsinghua, l'École d'intelligence artificielle Hillhouse de l'Université Renmin de Chine et l'équipe de Xiaohongshu ont remporté le meilleur article ; des chercheurs de l'Université de Glasgow et de l'Université de Pise ont remporté la deuxième place ; l'article a été décerné à l'Université du Shandong (Qingdao), à l'Université de Leiden et à l'Université d'Amsterdam ; le Time Test Award a été décerné à des chercheurs de l'Université Tsinghua et de l'Université de Californie à Santa Cruz. Ensuite, allons
- IA 498 2024-07-19 00:06:43
-
- Connectez-vous à Science, l'affinité des médicaments a été multipliée par 37, l'IA effectue une optimisation non supervisée des complexes de protéines et d'anticorps
- Les protéines de la peau du radis sont impliquées dans de nombreuses fonctions biologiques telles que la composition cellulaire, la contraction musculaire, la digestion des aliments et l'identification des virus. Afin de concevoir de meilleures protéines (y compris des anticorps), les scientifiques font souvent muter à plusieurs reprises les acides aminés (les unités qui composent les protéines dans un certain ordre) à différentes positions jusqu'à ce que la protéine obtienne la fonction souhaitée. Mais il existe plus de séquences d’acides aminés qu’il n’y a de grains de sable dans le monde, donc trouver les meilleures protéines, et donc les meilleurs médicaments potentiels, est souvent intimidant. Face à ce défi, les scientifiques dépensent souvent des millions de dollars et testent des versions miniaturisées et simplifiées de systèmes biologiques. "Cela nécessite beaucoup de conjectures et de vérifications."
- IA 769 2024-07-18 22:22:51
-
- Comment le cerveau traite-t-il le langage ? L'équipe de Princeton analyse le modèle Transformer
- Editeur | Radis Skin Lors du traitement du langage, le cerveau déploie des calculs spécialisés pour construire du sens à partir de structures linguistiques complexes. Le réseau de neurones artificiels basé sur l'architecture Transformer est un outil important pour le traitement du langage naturel. Des chercheurs de l'Université de Princeton explorent le modèle Transformer et la spécialisation fonctionnelle du cerveau humain dans le traitement du langage. Transformer calcule et intègre des informations contextuelles entre les mots via des circuits structurés. Cependant, les recherches actuelles se concentrent principalement sur les représentations internes (« embeddings ») générées par ces circuits. Les chercheurs ont analysé directement les calculs de circuits : ils ont déconstruit ces calculs en « transformations » fonctionnellement spécialisées qui intègrent des informations contextuelles à travers les mots. Exploiter les participants
- IA 686 2024-07-18 20:52:41
-
- Doubao Big Model Team publie un nouveau benchmark d'évaluation des légendes d'images détaillées pour améliorer la fiabilité de l'évaluation des légendes VLM
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Le modèle de langage visuel (VLM) actuel effectue principalement une évaluation des performances via un format de questions et réponses d'assurance qualité, mais manque d'évaluation de la compréhension de base du modèle, telle que des méthodes d'évaluation fiables pour performances de la légende de l'image détaillée. En réponse à ce problème, l'Académie chinoise des sciences,
- IA 768 2024-07-18 20:10:02
-
- Les nouveaux produits de la série Samsung China Galaxy Z accèdent au pouf grand modèle
- Le 17 juillet, Samsung Electronics a lancé une nouvelle génération de produits de la série Galaxy Z pour le marché chinois. Lors de la réunion, Samsung Electronics et Volcano Engine ont officiellement annoncé leur coopération pour connecter les modèles de poufs aux assistants intelligents et à la vision IA des téléphones mobiles Galaxy Z Fold6 et Galaxy Z Flip 6 afin d'améliorer l'expérience des applications intelligentes des téléphones mobiles. Auparavant, Samsung avait annoncé sa coopération approfondie avec Google Gemini lors du lancement de nouveaux produits à l'étranger. En Chine, il avait sélectionné des fabricants tels que Volcano Engine comme grands partenaires modèles. légende fenye : L'assistant intelligent et le modèle de pouf à accès visuel IA des téléphones mobiles Samsung Galaxy Z Fold6 et Galaxy Z Flip 6 En plus des fonctions IA qui ont été divulguées telles que la recherche en cercle, la traduction en temps réel, l'enregistrement de la transcription. , etc., cette fois
- IA 535 2024-07-18 20:07:33
-
- Abandonnant l'encodeur visuel, ce grand modèle multimodal « version native » est également comparable aux méthodes traditionnelles
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Diao Haiwen est doctorant à l'Université de technologie de Dalian et son superviseur est le professeur Lu Huchuan. Actuellement en stage à l'Institut de recherche sur l'intelligence artificielle Zhiyuan de Pékin, l'instructeur est le Dr Wang Xinlong. Ses intérêts de recherche sont la vision et le langage, le transfert efficace de grands modèles, les grands modèles multimodaux, etc. Faisons Cui ensemble
- IA 341 2024-07-18 19:21:11
-
- Tous ces VLM sont-ils aveugles ? GPT-4o et Sonnet-3.5 ont successivement échoué au test de « vision »
- Les quatre principaux VLM tentent tous de tromper les aveugles ? Laissez les modèles SOTA les plus populaires (GPT-4o, Gemini-1.5, Sonnet-3, Sonnet-3.5) compter le nombre d'intersections entre deux lignes. Seront-ils plus performants que les humains ? La réponse est probablement non. Depuis le lancement de GPT-4V, les modèles de langage visuel (VLM) ont permis à l'intelligence des grands modèles de faire un grand pas de plus vers le niveau d'intelligence artificielle que nous imaginions. Les VLM peuvent à la fois comprendre les images et utiliser un langage pour décrire ce qu'ils voient, et effectuer des tâches complexes basées sur ces compréhensions. Par exemple, si vous envoyez au modèle VLM une photo d'une table à manger et une photo d'un menu, il peut extraire le nombre de bouteilles de bière et le prix unitaire du menu à partir des deux images, et calculer
- IA 609 2024-07-18 18:18:02
-
- MotionClone : Aucune formation requise, clonage en un clic des mouvements vidéo
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Aucune formation ou réglage fin n'est requis. Le mouvement de la vidéo de référence peut être cloné dans la nouvelle scène spécifiée par le mot d'invite. mouvement du corps, cela peut être fait en un seul clic. Article : https://arxiv.org/abs/2406.05
- IA 971 2024-07-18 17:06:12
-
- Une nouvelle piste pour que les humains imitent l'IA, AI : Quand il s'agit de folie, tu es mon père
- Rédacteur du rapport sur le pouvoir des machines : l’IA de Yang Wen a été égarée par les humains ! Ce monde est tellement fou... Récemment, un tas de vidéos amusantes sont apparues sur les réseaux sociaux, sous la bannière de l'IA, de vraies personnes cosplayant avec l'IA, et Douyin a même un sujet brûlant : le concours d'imitation humaine de l'IA. (La vidéo vient du blogueur Douyin "Guan Ni Luan Shi") Lien vidéo : https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlwLes routines sont toutes les mêmes : une vieille photo à gauche, et "AI Repair" À droite, sous-titres, le « complot » sanglant des troncs cérébraux manquants est en réalité réalisé par de vraies personnes. -1-AI : C'est la première fois qu'on me fait passer pour, mais je ne m'attendais pas à ce que ce soit pire que le mien.
- IA 1580 2024-07-18 16:51:08
-
- L'efficacité d'inférence des grands modèles a été multipliée par 3 sans perte. L'Université de Waterloo, l'Université de Pékin et d'autres institutions ont publié EAGLE.
- Les grands modèles de langage (LLM) sont de plus en plus utilisés dans divers domaines. Cependant, leur processus de génération de texte est coûteux et lent. Cette inefficacité est attribuée aux règles de fonctionnement du décodage autorégressif : la génération de chaque mot (token) nécessite une propagation vers l'avant, nécessitant l'accès à un LLM de milliards à centaines de milliards de paramètres. Cela se traduit par un décodage autorégressif traditionnel plus lent. Récemment, l'Université de Waterloo, le Canadian Vector Institute, l'Université de Pékin et d'autres institutions ont publié conjointement EAGLE, qui vise à améliorer la vitesse d'inférence des grands modèles de langage tout en assurant une distribution cohérente du texte de sortie du modèle. Cette méthode extrapole le deuxième vecteur de fonctionnalités de haut niveau de LLM, ce qui peut améliorer considérablement l'efficacité de la génération. Rapport technique : https://sites.google.com/view
- IA 873 2024-07-18 14:43:48
-
- Pour évaluer efficacement les performances réelles de l'Agent, le nouveau cadre d'évaluation en ligne WebCanvas est ici
- Pan Yichen : étudiant en première année de master à l’Université du Zhejiang. Kong Dehan : responsable de l'algorithme de modèle chez Cross Star Technology. Zhou Sida : Diplômé de l'Université de Nanchang en 2024, il étudiera pour une maîtrise à l'Université des sciences et technologies électroniques de Xi'an. Cui Cheng : diplômé en 2024 de l'Université de médecine traditionnelle chinoise du Zhejiang et étudiera pour une maîtrise à l'Université de Suzhou. Pan Yichen, Zhou Sida et Cui Cheng ont réalisé conjointement les travaux de recherche de cet article en tant que stagiaires en algorithme chez Cross Star Technology. À l'ère actuelle de développement technologique rapide, le Large Language Model (LLM) change la façon dont nous interagissons avec le monde numérique à une vitesse sans précédent. Les agents intelligents basés sur LLM (LLMAgent) sont progressivement intégrés, depuis la simple recherche d'informations jusqu'aux opérations complexes sur les pages Web.
- IA 512 2024-07-18 14:04:51
-
- AKOOL soutient les Cannes Advertising Awards et lance une plateforme humaine numérique révolutionnaire en temps réel
- Alors que la Coupe d’Europe 2024 bat son plein, une vidéo d’un match de football réalisée par l’entreprise française de télécommunications Orange est également rapidement devenue populaire. Dans la vidéo, on a vu Mbappé, Giroud, Griezmann... En fait, tous les athlètes qui courent sur le terrain ne sont pas de vraies personnes, mais des personnages virtuels générés par l'intelligence artificielle. Grâce à sa créativité exceptionnelle et à son caractère unique, l'œuvre a remporté l'« Oscar » dans l'industrie du marketing créatif publicitaire - le prix de la catégorie sport au Festival international de la créativité Cannes Lions de cette année. AKOOL a fourni un support technique de base pour ce travail primé. Le système de capture faciale IA qu'ils ont développé peut capturer avec précision les expressions et les mouvements subtils des visages humains. Avec le soutien d'une technologie de rendu soigneusement conçue, les personnages virtuels de l'œuvre.
- IA 421 2024-07-18 09:26:11
-
- 178 pages, 128 cas, évaluation complète du GPT-4V dans le domaine médical, encore loin de l'application clinique et de la prise de décision pratique
- L'Université Jiao Tong de Shanghai et l'AILab de Shanghai ont publié une étude de cas médical du GPT-4V de 178 pages, révélant pour la première fois de manière exhaustive les performances visuelles du GPT-4V dans le domaine médical. Poussé par des modèles de base à grande échelle, le développement de l'intelligence artificielle a fait de grands progrès récemment, en particulier le GPT-4 d'OpenAI. Ses puissantes capacités de questions-réponses et de connaissances ont illuminé le moment Eureka dans le domaine de l'IA, provoquant un large public. préoccupation. GPT-4V(ision) est le dernier modèle de base multimodal d'OpenAI. Par rapport à GPT-4, il ajoute des capacités de saisie d’images et de voix. Cette étude vise à évaluer les performances du GPT-4V(ision) dans le domaine du diagnostic médical multimodal à travers une analyse de cas au total 1.
- IA 1147 2024-07-18 06:20:10