localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA

  • Conversation exclusive avec Li Yan : Financée par Suhua, Jingwei et Redpoint, la première startup de « recommandation générative » AI Pioneers |
    Conversation exclusive avec Li Yan : Financée par Suhua, Jingwei et Redpoint, la première startup de « recommandation générative » AI Pioneers |
    L’humanité inaugure une mise à jour explosive dans le domaine de l’intelligence artificielle. Presque chaque étape de l’expansion de la technologie vers l’inconnu a attiré une attention étonnante. Dans le processus de repoussement des frontières de l'intelligence artificielle, l'innovation et le désaccord cohabitent dans les parcours techniques des pistes importantes. Le jugement et les choix des pionniers de la technologie influencent les traces de nombreux adeptes. Au cours de l'année écoulée, ce site Web a pris les devants en exclusivité en présentant à tout le monde des sociétés exceptionnelles telles que Dark Side of the Moon, Shengshu Technology, Aishi Technology et Wuwen Core Dome, leur laissant avec le premier « script d'interview de 10 000 mots » en le monde Internet. À un stade où la feuille de route technique n’a pas encore convergé, nous avons vu le leadership d’entrepreneurs en IA qui ont véritablement foi, courage et cognition systématique. C’est pourquoi nous lançons « AIPioneers »
    IA 880 2024-07-19 05:03:59
  • Travail posthume de l'équipe OpenAI Super Alignment : deux grands modèles jouent à un jeu et le résultat devient plus compréhensible
    Travail posthume de l'équipe OpenAI Super Alignment : deux grands modèles jouent à un jeu et le résultat devient plus compréhensible
    Si la réponse donnée par le modèle d’IA est incompréhensible du tout, oseriez-vous l’utiliser ? À mesure que les systèmes d’apprentissage automatique sont utilisés dans des domaines de plus en plus importants, il devient de plus en plus important de démontrer pourquoi nous pouvons faire confiance à leurs résultats, et quand ne pas leur faire confiance. Une façon possible de gagner confiance dans le résultat d'un système complexe est d'exiger que le système produise une interprétation de son résultat qui soit lisible par un humain ou un autre système de confiance, c'est-à-dire entièrement compréhensible au point que toute erreur possible puisse être trouvé. Par exemple, pour renforcer la confiance dans le système judiciaire, nous exigeons que les tribunaux fournissent des avis écrits clairs et lisibles qui expliquent et soutiennent leurs décisions. Pour les grands modèles de langage, nous pouvons également adopter une approche similaire. Cependant, lorsque vous adoptez cette approche, assurez-vous que le modèle de langage génère
    IA 769 2024-07-19 01:29:52
  • L'Université Tsinghua a remporté le prix du meilleur article + test de temps, l'Université du Shandong a reçu une mention honorable et les prix SIGIR 2024 ont été annoncés
    L'Université Tsinghua a remporté le prix du meilleur article + test de temps, l'Université du Shandong a reçu une mention honorable et les prix SIGIR 2024 ont été annoncés
    Les résultats de l’Université Tsinghua sont exceptionnels. La 47e Conférence de l'International Computer Society sur la recherche d'informations (ACMSIGIR) se tiendra à Washington, DC, États-Unis, du 14 au 18 juillet 2024. Cette conférence est la plus grande conférence académique dans le domaine de la recherche d'informations. Tout à l'heure, la conférence a annoncé le prix du meilleur article, le prix du meilleur article, le prix de la mention honorable du meilleur article et le prix Time Test. Parmi eux, l'Université Tsinghua, l'École d'intelligence artificielle Hillhouse de l'Université Renmin de Chine et l'équipe de Xiaohongshu ont remporté le meilleur article ; des chercheurs de l'Université de Glasgow et de l'Université de Pise ont remporté la deuxième place ; l'article a été décerné à l'Université du Shandong (Qingdao), à l'Université de Leiden et à l'Université d'Amsterdam ; le Time Test Award a été décerné à des chercheurs de l'Université Tsinghua et de l'Université de Californie à Santa Cruz. Ensuite, allons
    IA 498 2024-07-19 00:06:43
  • Connectez-vous à Science, l'affinité des médicaments a été multipliée par 37, l'IA effectue une optimisation non supervisée des complexes de protéines et d'anticorps
    Connectez-vous à Science, l'affinité des médicaments a été multipliée par 37, l'IA effectue une optimisation non supervisée des complexes de protéines et d'anticorps
    Les protéines de la peau du radis sont impliquées dans de nombreuses fonctions biologiques telles que la composition cellulaire, la contraction musculaire, la digestion des aliments et l'identification des virus. Afin de concevoir de meilleures protéines (y compris des anticorps), les scientifiques font souvent muter à plusieurs reprises les acides aminés (les unités qui composent les protéines dans un certain ordre) à différentes positions jusqu'à ce que la protéine obtienne la fonction souhaitée. Mais il existe plus de séquences d’acides aminés qu’il n’y a de grains de sable dans le monde, donc trouver les meilleures protéines, et donc les meilleurs médicaments potentiels, est souvent intimidant. Face à ce défi, les scientifiques dépensent souvent des millions de dollars et testent des versions miniaturisées et simplifiées de systèmes biologiques. "Cela nécessite beaucoup de conjectures et de vérifications."
    IA 769 2024-07-18 22:22:51
  • Comment le cerveau traite-t-il le langage ? L'équipe de Princeton analyse le modèle Transformer
    Comment le cerveau traite-t-il le langage ? L'équipe de Princeton analyse le modèle Transformer
    Editeur | Radis Skin Lors du traitement du langage, le cerveau déploie des calculs spécialisés pour construire du sens à partir de structures linguistiques complexes. Le réseau de neurones artificiels basé sur l'architecture Transformer est un outil important pour le traitement du langage naturel. Des chercheurs de l'Université de Princeton explorent le modèle Transformer et la spécialisation fonctionnelle du cerveau humain dans le traitement du langage. Transformer calcule et intègre des informations contextuelles entre les mots via des circuits structurés. Cependant, les recherches actuelles se concentrent principalement sur les représentations internes (« embeddings ») générées par ces circuits. Les chercheurs ont analysé directement les calculs de circuits : ils ont déconstruit ces calculs en « transformations » fonctionnellement spécialisées qui intègrent des informations contextuelles à travers les mots. Exploiter les participants
    IA 686 2024-07-18 20:52:41
  • Doubao Big Model Team publie un nouveau benchmark d'évaluation des légendes d'images détaillées pour améliorer la fiabilité de l'évaluation des légendes VLM
    Doubao Big Model Team publie un nouveau benchmark d'évaluation des légendes d'images détaillées pour améliorer la fiabilité de l'évaluation des légendes VLM
    La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Le modèle de langage visuel (VLM) actuel effectue principalement une évaluation des performances via un format de questions et réponses d'assurance qualité, mais manque d'évaluation de la compréhension de base du modèle, telle que des méthodes d'évaluation fiables pour performances de la légende de l'image détaillée. En réponse à ce problème, l'Académie chinoise des sciences,
    IA 768 2024-07-18 20:10:02
  • Les nouveaux produits de la série Samsung China Galaxy Z accèdent au pouf grand modèle
    Les nouveaux produits de la série Samsung China Galaxy Z accèdent au pouf grand modèle
    Le 17 juillet, Samsung Electronics a lancé une nouvelle génération de produits de la série Galaxy Z pour le marché chinois. Lors de la réunion, Samsung Electronics et Volcano Engine ont officiellement annoncé leur coopération pour connecter les modèles de poufs aux assistants intelligents et à la vision IA des téléphones mobiles Galaxy Z Fold6 et Galaxy Z Flip 6 afin d'améliorer l'expérience des applications intelligentes des téléphones mobiles. Auparavant, Samsung avait annoncé sa coopération approfondie avec Google Gemini lors du lancement de nouveaux produits à l'étranger. En Chine, il avait sélectionné des fabricants tels que Volcano Engine comme grands partenaires modèles. légende fenye : L'assistant intelligent et le modèle de pouf à accès visuel IA des téléphones mobiles Samsung Galaxy Z Fold6 et Galaxy Z Flip 6 En plus des fonctions IA qui ont été divulguées telles que la recherche en cercle, la traduction en temps réel, l'enregistrement de la transcription. , etc., cette fois
    IA 535 2024-07-18 20:07:33
  • Abandonnant l'encodeur visuel, ce grand modèle multimodal « version native » est également comparable aux méthodes traditionnelles
    Abandonnant l'encodeur visuel, ce grand modèle multimodal « version native » est également comparable aux méthodes traditionnelles
    La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Diao Haiwen est doctorant à l'Université de technologie de Dalian et son superviseur est le professeur Lu Huchuan. Actuellement en stage à l'Institut de recherche sur l'intelligence artificielle Zhiyuan de Pékin, l'instructeur est le Dr Wang Xinlong. Ses intérêts de recherche sont la vision et le langage, le transfert efficace de grands modèles, les grands modèles multimodaux, etc. Faisons Cui ensemble
    IA 341 2024-07-18 19:21:11
  • Tous ces VLM sont-ils aveugles ? GPT-4o et Sonnet-3.5 ont successivement échoué au test de « vision »
    Tous ces VLM sont-ils aveugles ? GPT-4o et Sonnet-3.5 ont successivement échoué au test de « vision »
    Les quatre principaux VLM tentent tous de tromper les aveugles ? Laissez les modèles SOTA les plus populaires (GPT-4o, Gemini-1.5, Sonnet-3, Sonnet-3.5) compter le nombre d'intersections entre deux lignes. Seront-ils plus performants que les humains ? La réponse est probablement non. Depuis le lancement de GPT-4V, les modèles de langage visuel (VLM) ont permis à l'intelligence des grands modèles de faire un grand pas de plus vers le niveau d'intelligence artificielle que nous imaginions. Les VLM peuvent à la fois comprendre les images et utiliser un langage pour décrire ce qu'ils voient, et effectuer des tâches complexes basées sur ces compréhensions. Par exemple, si vous envoyez au modèle VLM une photo d'une table à manger et une photo d'un menu, il peut extraire le nombre de bouteilles de bière et le prix unitaire du menu à partir des deux images, et calculer
    IA 609 2024-07-18 18:18:02
  • MotionClone : Aucune formation requise, clonage en un clic des mouvements vidéo
    MotionClone : Aucune formation requise, clonage en un clic des mouvements vidéo
    La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Aucune formation ou réglage fin n'est requis. Le mouvement de la vidéo de référence peut être cloné dans la nouvelle scène spécifiée par le mot d'invite. mouvement du corps, cela peut être fait en un seul clic. Article : https://arxiv.org/abs/2406.05
    IA 971 2024-07-18 17:06:12
  • Une nouvelle piste pour que les humains imitent l'IA, AI : Quand il s'agit de folie, tu es mon père
    Une nouvelle piste pour que les humains imitent l'IA, AI : Quand il s'agit de folie, tu es mon père
    Rédacteur du rapport sur le pouvoir des machines : l’IA de Yang Wen a été égarée par les humains ! Ce monde est tellement fou... Récemment, un tas de vidéos amusantes sont apparues sur les réseaux sociaux, sous la bannière de l'IA, de vraies personnes cosplayant avec l'IA, et Douyin a même un sujet brûlant : le concours d'imitation humaine de l'IA. (La vidéo vient du blogueur Douyin "Guan Ni Luan Shi") Lien vidéo : https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlwLes routines sont toutes les mêmes : une vieille photo à gauche, et "AI Repair" À droite, sous-titres, le « complot » sanglant des troncs cérébraux manquants est en réalité réalisé par de vraies personnes. -1-AI : C'est la première fois qu'on me fait passer pour, mais je ne m'attendais pas à ce que ce soit pire que le mien.
    IA 1580 2024-07-18 16:51:08
  • L'efficacité d'inférence des grands modèles a été multipliée par 3 sans perte. L'Université de Waterloo, l'Université de Pékin et d'autres institutions ont publié EAGLE.
    L'efficacité d'inférence des grands modèles a été multipliée par 3 sans perte. L'Université de Waterloo, l'Université de Pékin et d'autres institutions ont publié EAGLE.
    Les grands modèles de langage (LLM) sont de plus en plus utilisés dans divers domaines. Cependant, leur processus de génération de texte est coûteux et lent. Cette inefficacité est attribuée aux règles de fonctionnement du décodage autorégressif : la génération de chaque mot (token) nécessite une propagation vers l'avant, nécessitant l'accès à un LLM de milliards à centaines de milliards de paramètres. Cela se traduit par un décodage autorégressif traditionnel plus lent. Récemment, l'Université de Waterloo, le Canadian Vector Institute, l'Université de Pékin et d'autres institutions ont publié conjointement EAGLE, qui vise à améliorer la vitesse d'inférence des grands modèles de langage tout en assurant une distribution cohérente du texte de sortie du modèle. Cette méthode extrapole le deuxième vecteur de fonctionnalités de haut niveau de LLM, ce qui peut améliorer considérablement l'efficacité de la génération. Rapport technique : https://sites.google.com/view
    IA 873 2024-07-18 14:43:48
  • Pour évaluer efficacement les performances réelles de l'Agent, le nouveau cadre d'évaluation en ligne WebCanvas est ici
    Pour évaluer efficacement les performances réelles de l'Agent, le nouveau cadre d'évaluation en ligne WebCanvas est ici
    Pan Yichen : étudiant en première année de master à l’Université du Zhejiang. Kong Dehan : responsable de l'algorithme de modèle chez Cross Star Technology. Zhou Sida : Diplômé de l'Université de Nanchang en 2024, il étudiera pour une maîtrise à l'Université des sciences et technologies électroniques de Xi'an. Cui Cheng : diplômé en 2024 de l'Université de médecine traditionnelle chinoise du Zhejiang et étudiera pour une maîtrise à l'Université de Suzhou. Pan Yichen, Zhou Sida et Cui Cheng ont réalisé conjointement les travaux de recherche de cet article en tant que stagiaires en algorithme chez Cross Star Technology. À l'ère actuelle de développement technologique rapide, le Large Language Model (LLM) change la façon dont nous interagissons avec le monde numérique à une vitesse sans précédent. Les agents intelligents basés sur LLM (LLMAgent) sont progressivement intégrés, depuis la simple recherche d'informations jusqu'aux opérations complexes sur les pages Web.
    IA 512 2024-07-18 14:04:51
  • AKOOL soutient les Cannes Advertising Awards et lance une plateforme humaine numérique révolutionnaire en temps réel
    AKOOL soutient les Cannes Advertising Awards et lance une plateforme humaine numérique révolutionnaire en temps réel
    Alors que la Coupe d’Europe 2024 bat son plein, une vidéo d’un match de football réalisée par l’entreprise française de télécommunications Orange est également rapidement devenue populaire. Dans la vidéo, on a vu Mbappé, Giroud, Griezmann... En fait, tous les athlètes qui courent sur le terrain ne sont pas de vraies personnes, mais des personnages virtuels générés par l'intelligence artificielle. Grâce à sa créativité exceptionnelle et à son caractère unique, l'œuvre a remporté l'« Oscar » dans l'industrie du marketing créatif publicitaire - le prix de la catégorie sport au Festival international de la créativité Cannes Lions de cette année. AKOOL a fourni un support technique de base pour ce travail primé. Le système de capture faciale IA qu'ils ont développé peut capturer avec précision les expressions et les mouvements subtils des visages humains. Avec le soutien d'une technologie de rendu soigneusement conçue, les personnages virtuels de l'œuvre.
    IA 421 2024-07-18 09:26:11
  • 178 pages, 128 cas, évaluation complète du GPT-4V dans le domaine médical, encore loin de l'application clinique et de la prise de décision pratique
    178 pages, 128 cas, évaluation complète du GPT-4V dans le domaine médical, encore loin de l'application clinique et de la prise de décision pratique
    L'Université Jiao Tong de Shanghai et l'AILab de Shanghai ont publié une étude de cas médical du GPT-4V de 178 pages, révélant pour la première fois de manière exhaustive les performances visuelles du GPT-4V dans le domaine médical. Poussé par des modèles de base à grande échelle, le développement de l'intelligence artificielle a fait de grands progrès récemment, en particulier le GPT-4 d'OpenAI. Ses puissantes capacités de questions-réponses et de connaissances ont illuminé le moment Eureka dans le domaine de l'IA, provoquant un large public. préoccupation. GPT-4V(ision) est le dernier modèle de base multimodal d'OpenAI. Par rapport à GPT-4, il ajoute des capacités de saisie d’images et de voix. Cette étude vise à évaluer les performances du GPT-4V(ision) dans le domaine du diagnostic médical multimodal à travers une analyse de cas au total 1.
    IA 1147 2024-07-18 06:20:10

Recommandations d'outils

Code de contact du formulaire de message d'entreprise jQuery

Le code de contact du formulaire de message d'entreprise jQuery est un formulaire de message d'entreprise simple et pratique et le code de la page d'introduction contactez-nous.

Effets de lecture de boîte à musique HTML5 MP3

L'effet spécial de lecture de boîte à musique HTML5 MP3 est un lecteur de musique MP3 basé sur HTML5 + CSS3 pour créer de jolies émoticônes de boîte à musique et cliquer sur le bouton de commutation.

Effets spéciaux du menu de navigation d'animation de particules cool HTML5

L'effet de menu de navigation d'animation de particules cool HTML5 est un effet spécial qui change de couleur lorsque le menu de navigation est survolé par la souris.

Code d'édition par glisser-déposer du formulaire visuel jQuery

Le code d'édition par glisser-déposer du formulaire visuel jQuery est un formulaire visuel basé sur jQuery et le framework bootstrap.

Modèle Web de fournisseur de fruits et légumes biologiques Bootstrap5

Un modèle Web de fournisseur de fruits et légumes biologiques-Bootstrap5
Modèle d'amorçage
2023-02-03

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus
modèle de back-end
2023-02-02

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5
Modèle d'amorçage
2023-02-02

Modèle Web d'informations de CV simples Bootstrap4

Modèle Web d'informations de CV simples Bootstrap4
Modèle d'amorçage
2023-02-02

Matériau vectoriel d'éléments d'été mignons (EPS+PNG)

Il s'agit d'un joli matériau vectoriel d'éléments d'été, comprenant le soleil, un chapeau de soleil, un cocotier, un bikini, un avion, une pastèque, une crème glacée, une boisson fraîche, une bouée, des tongs, un ananas, une conque, une coquille, une étoile de mer, un crabe. , Citrons, crème solaire, lunettes de soleil, etc., le matériel est fourni aux formats EPS et PNG, y compris des aperçus JPG.
Matériau PNG
2024-05-09

Matériel vectoriel de quatre badges de graduation rouges 2023 (AI+EPS+PNG)

Il s'agit d'un matériau vectoriel de badge de remise des diplômes rouge 2023, quatre au total, disponible aux formats AI, EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-29

Oiseau chantant et chariot rempli de fleurs design matériel vectoriel de bannière de printemps (AI + EPS)

Il s'agit d'un matériau vectoriel de bannière printanière conçu avec des oiseaux chanteurs et un chariot rempli de fleurs. Il est disponible aux formats AI et EPS, y compris l'aperçu JPG.
image de bannière
2024-02-29

Matériau vectoriel de chapeau de graduation doré (EPS+PNG)

Il s'agit d'un matériau vectoriel de casquette de graduation dorée, disponible aux formats EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-27

Modèle de site Web d'entreprise de services de nettoyage et de réparation de décoration intérieure

Le modèle de site Web d'entreprise de services de nettoyage et d'entretien de décoration d'intérieur est un modèle de site Web à télécharger adapté aux sites Web promotionnels qui proposent des services de décoration, de nettoyage, d'entretien et d'autres organisations de services. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-05-09

Modèle de page de guide de CV personnel aux couleurs fraîches

Le modèle de page de guide de CV de candidature personnelle de correspondance de couleurs fraîches est un téléchargement de modèle Web de page de guide d'affichage de travail de CV de recherche d'emploi personnel adapté au style de correspondance de couleurs fraîches. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-29

Modèle Web de CV de travail créatif de concepteur

Le modèle Web de CV de travail créatif de concepteur est un modèle Web téléchargeable pour l'affichage de CV personnels adapté à divers postes de concepteur. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28

Modèle de site Web d'entreprise de construction d'ingénierie moderne

Le modèle de site Web d'entreprise d'ingénierie et de construction moderne est un modèle de site Web téléchargeable adapté à la promotion du secteur des services d'ingénierie et de construction. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28