localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- La question ultime de l'explicabilité est la suivante : quelle est la première explication ? 20 articles CCF-A+ICLR vous donnent des réponses
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de cet article sont Zhang Junpeng, Ren Qihan et Zhang Quanshi. Zhang Junpeng est un futur doctorant de Zhang Quanshi et Ren Qihan est un doctorant de Zhang. Quanshi. Cet article passe d'abord brièvement en revue le « Système théorique d'interprétabilité des interactions équivalentes » (20 articles du CCF-A et de l'ICLR
- IA 921 2024-08-05 15:55:55
-
- Une autre « version domestique de Sora » est lancée à l'échelle mondiale ! L'équipe entrepreneuriale de Tsinghua Zhu Jun, la génération de vidéos ne prend que 30 secondes
- Le cercle vidéo de l'IA « se bat la tête ». Luma et Runway à l'étranger, Kuaishou Keling, Byte Dream, Zhipu Qingying au niveau national... vous chantez et j'apparaîtrai. Sans exception, ils ciblent tous le légendaire Sora. En fait, face aux challengers mondiaux de Sora, Vidu de Shengshu Technology est indispensable. Il y a trois mois déjà, alors que le domaine de la génération vidéo au pays et à l'étranger était encore « silencieux », Shengshu Technology a soudainement exposé la vidéo promotionnelle de son dernier modèle vidéo à grande échelle Vidu avec son effet vif et réaliste, ce qui n'est pas le cas. inférieur à Sora, cela a choqué tout le monde. Aujourd'hui encore, Vidu est officiellement lancé. Aucune candidature n'est requise, tant que vous disposez d'une adresse e-mail, vous pouvez commencer. (Lien du site officiel de Vidu : www.vidu.stud
- IA 868 2024-08-05 15:46:59
-
- Une avancée significative dans l'hypothèse de Riemann ! Tao Zhexuan recommande fortement les nouveaux articles du MIT et d'Oxford, et le lauréat de la médaille Fields, âgé de 37 ans, a participé
- Récemment, l’hypothèse de Riemann, connue comme l’un des sept problèmes majeurs du millénaire, a réalisé une nouvelle avancée. L'hypothèse de Riemann est un problème mathématique non résolu très important, lié aux propriétés précises de la distribution des nombres premiers (les nombres premiers sont les nombres qui ne sont divisibles que par 1 et par eux-mêmes, et jouent un rôle fondamental dans la théorie des nombres). Dans la littérature mathématique actuelle, il existe plus d'un millier de propositions mathématiques basées sur l'établissement de l'hypothèse de Riemann (ou sa forme généralisée). En d’autres termes, une fois que l’hypothèse de Riemann et sa forme généralisée seront prouvées, ces plus d’un millier de propositions seront établies sous forme de théorèmes, qui auront un impact profond sur le domaine des mathématiques et si l’hypothèse de Riemann s’avère fausse, alors parmi eux ; ces propositions qui en font partie perdront également de leur efficacité. Une nouvelle percée vient du professeur de mathématiques du MIT, Larry Guth, et de l'Université d'Oxford
- IA 1176 2024-08-05 15:32:26
-
- Llama devient le top model parmi les grands mannequins, Zuckerberg lance un débat : en jouant à l'open source, les temps ont changé
- Le conflit entre l'open source et le fermé dure depuis longtemps et il a peut-être atteint un nouveau point culminant. En ce qui concerne les grands modèles open source, la série Llama est un représentant typique depuis sa naissance. Ses excellentes performances et ses fonctionnalités open source ont considérablement amélioré l'applicabilité et l'accessibilité de la technologie de l'intelligence artificielle. Tout chercheur et développeur peut en bénéficier, rendant ainsi la recherche et les applications plus répandues. Désormais, MetaLlama3.1405B est officiellement publié. Dans le blog officiel, Meta a déclaré : « Jusqu'à aujourd'hui, les grands modèles de langage open source étaient pour la plupart à la traîne des modèles fermés en termes de fonctionnalités et de performances. Nous inaugurons désormais une nouvelle ère dirigée par le fondateur de Meta, Zuckerberg. open source L'importance de l'IA Open source est une condition nécessaire au développement de l'IA Fondateur et PDG de Meta.
- IA 948 2024-08-05 15:22:07
-
- La « version de Sora à trajectoire contrôlable » d'Alibaba fait ses adieux au « tirage de cartes » et rend la génération vidéo plus conforme aux lois physiques
- Vous spécifiez un itinéraire et Tora génère une vidéo de la trajectoire correspondante. Actuellement, les modèles de diffusion sont capables de générer des images ou des vidéos diversifiées et de haute qualité. Auparavant, les modèles de diffusion vidéo utilisaient l'architecture U-Net, principalement axée sur la synthèse de vidéos de durée limitée (généralement environ deux secondes), avec des contraintes fixes sur la résolution et le format d'image. L'émergence de Sora brise cette limitation. Il utilise l'architecture DiffusionTransformer (DiT), qui est non seulement efficace pour produire des vidéos de haute qualité de 10 à 60 secondes, mais aussi grâce à sa capacité à générer différentes résolutions, différents formats d'image et obéissez aux lois réelles de la physique et démarquez-vous. On peut dire que Sora est la preuve la plus favorable de l'architecture DiT. Cependant, le modèle de diffusion basé sur Transformer est efficace dans.
- IA 872 2024-08-05 15:10:01
-
- La grande séance de partage d'articles modèles de Xiaohongshu a réuni des auteurs de quatre grandes conférences internationales
- Les grands modèles mènent une nouvelle vague de recherche, avec de nombreux résultats innovants émergeant tant dans l’industrie que dans le monde universitaire. L'équipe technique de Xiaohongshu explore également constamment cette vague, et les résultats de recherche de nombreux articles ont été fréquemment présentés lors de conférences internationales de premier plan telles que ICLR, ACL, CVPR, AAAI, SIGIR et WWW. Quels nouveaux défis et opportunités découvrons-nous à l’intersection des grands modèles et du traitement du langage naturel ? Quelles sont les méthodes d’évaluation efficaces pour les grands modèles ? Comment mieux l’intégrer dans les scénarios d’application ? De 19h00 à 21h30 le 27 juin, [REDtech arrive] Le onzième numéro de « Xiaohongshu 2024 Large Model Frontier Paper Sharing » sera diffusé en ligne ! REDtech a spécialement invité l'équipe de recherche communautaire de Xiaohongshu dans la salle de diffusion en direct.
- IA 708 2024-08-05 14:33:02
-
- Article très bien noté de COLM, la première conférence sur les grands modèles : L'algorithme de recherche de préférences PairS rend l'évaluation textuelle des grands modèles plus efficace
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de l'article sont tous du laboratoire de technologie linguistique de l'université de Cambridge. L'un d'entre eux est Liu Yinhong, un étudiant en troisième année de doctorat, et ses superviseurs sont les professeurs Nigel Collier et. Ehsan Shareghi. Ses intérêts de recherche portent sur l'évaluation de grands modèles et de textes, la génération de données, etc. commun
- IA 976 2024-08-05 14:31:52
-
- L'efficacité du RNN est comparable à celle de Transformer, la nouvelle architecture de Google a deux versions consécutives : elle est plus puissante que Mamba à la même échelle
- En décembre de l'année dernière, la nouvelle architecture Mamba a fait exploser le cercle de l'IA et a défié l'éternel Transformer. Aujourd'hui, le lancement de Google DeepMind « Hawk » et « Griffin » offre de nouvelles options pour le cercle de l'IA. Cette fois, Google DeepMind a fait de nouveaux progrès en termes de modèles de base. Nous savons que les réseaux neuronaux récurrents (RNN) ont joué un rôle central dans les premiers jours de la recherche sur l'apprentissage profond et le traitement du langage naturel et ont obtenu des résultats pratiques dans de nombreuses applications, notamment le premier système de traduction automatique de bout en bout de Google. Cependant, ces dernières années, l’apprentissage profond et le NLP ont été dominés par l’architecture Transformer, qui combine le perceptron multicouche (MLP) et l’attention multi-têtes (MHA). Tra
- IA 1146 2024-08-05 14:20:15
-
- Alignement des capacités, texte long, Claude 3, cette fois nous parlerons des chemins techniques clés des grands modèles
- Les modèles de texte volumineux ont atteint de nouveaux sommets. Claude3 surpasse GPT-4 et Gemini 1.0 Ultra, lancés il y a moins d'un mois, dans de multiples dimensions telles que les mathématiques, la programmation, la compréhension multilingue et la vision. « Une évolution rapide » ne suffit plus à décrire la tendance actuelle de développement de la technologie des grands modèles. Afin de mieux partager les derniers progrès en matière de technologie des grands modèles, en 2024, ce site, Zhangjiang Science and Technology Investment, Zhangjiang Incubator et WAICCircle ont lancé conjointement la série d'activités « Large Model Technology Workshop », invitant des experts de première ligne de l'industrie et du monde universitaire. , et la recherche pour apporter des observations et des idées de pointe. Dans l'après-midi du 22 mars, au 3ème étage du bloc A, bâtiment Kehai, n° 800 Naxian Road, Zhangjiang, Shanghai, sur le thème « La canicule Claude3 arrive, parlons des principales voies techniques des grands modèles de texte ".
- IA 1229 2024-08-05 14:01:32
-
- Un autre joueur de niveau Sora arrive dans la rue ! Nous l'avons comparé à Sora et Keling.
- Lorsque Sora n'est pas parvenu à se manifester, les adversaires d'OpenAI ont utilisé leurs armes pour détruire les rues. Si Sora n'est pas ouvert à l'utilisation, il sera vraiment volé ! Aujourd'hui, la startup de San Francisco, LumaAI, a joué un atout et a lancé une nouvelle génération de modèle de génération vidéo IA DreamMachine. Gratuit et accessible à tous. Selon les rapports, le modèle peut générer des vidéos réalistes de haute qualité basées sur de simples descriptions textuelles, avec des effets comparables à ceux de Sora. Dès l’annonce de la nouvelle, un grand nombre d’utilisateurs se sont rassemblés sur le site officiel pour l’essayer. Bien que les responsables affirment que le modèle peut générer une vidéo de 120 images en seulement deux minutes, de nombreux utilisateurs attendent depuis des heures sur le site officiel en raison d'une augmentation des visites. BarkleyDai, responsable de la croissance des produits chez Luma, a dû commenter Discord
- IA 776 2024-08-02 10:19:44
-
- Comment faire en sorte que les cellules fassent des calculs ? Quatre universités nationales ont proposé une nouvelle méthode de conception de composants informatiques biologiques et ont été répertoriées dans Cell
- Editeur | Auteur de Carrot Skin | Équipe de thèse Une cellule est comme un ordinateur, recevant, analysant et traitant chaque seconde différentes informations provenant de l'environnement : les informations externes sont analysées et traitées par des voies de transduction de signal hautement parallèles dans la cellule, puis elles lisent les informations. (expression génique) ou écrit des instructions (modification et édition de l'ADN) à partir du « dispositif de stockage » (c'est-à-dire l'ADN) d'une manière prédéfinie pour se guider ou guider les cellules environnantes pour répondre aux informations environnementales. Le domaine de l'informatique et de la biotechnologie a toujours porté sur la manière d'utiliser efficacement la puissance de calcul des organismes, de transformer les organismes afin qu'ils puissent effectuer des tâches informatiques confiées par les humains et de développer de nouveaux concepts informatiques basés sur des systèmes biologiques. . Récemment, de l'Université nationale de technologie de la défense, West Lake
- IA 676 2024-08-02 07:26:54
-
- Les nouvelles fonctionnalités de Poe sont tellement puissantes ! Même sans aucune compétence en programmation, vous pouvez créer un éditeur de mèmes en 10 minutes
- Editeur du Machine Power Report : Est-il nécessaire que les grands modèles nationaux de Sia rattrapent rapidement leur retard ? Récemment, Poe, une plateforme de chat IA appartenant à Quora, une communauté de questions-réponses en Amérique du Nord, a lancé une nouvelle fonctionnalité appelée « Aperçus ». Grâce à cette fonctionnalité de prévisualisation en temps réel, les utilisateurs peuvent directement visualiser et utiliser les applications Web générées dans le chat Poe. C'est-à-dire que dans Poe, vous pouvez discuter avec certains LLM qui sont très bons en codage, comme Claude-3.5-Sonnet, GPT-4, Gemini1.5Pro. Les extraits de code, la conception Web, les jeux et autres contenus générés pendant le chat peuvent être prévisualisés dans cette fenêtre et peuvent être utilisés pour une expérience pratique. Quand je l'ai essayé pour la première fois, l'éditeur n'ayant aucune connaissance en programmation avait peur.
- IA 1423 2024-08-02 00:23:25
-
- Deng Yawen remporte la 8e médaille d'or olympique de la Chine, le « Bullet Time » d'Alibaba Cloud fige les moments les plus éblouissants
- Le soir du 31 juillet, lors de la finale de la course de park freestyle féminin BMX aux Jeux Olympiques de Paris, l'athlète chinoise Deng Yawen, 18 ans, a réalisé une performance de haut niveau et a remporté la huitième médaille d'or pour la délégation chinoise. Lors de la rediffusion de la diffusion en direct du jeu, la silhouette de Deng Yawen sautant haut alors qu'elle conduisait un scooter s'est soudainement figée et la caméra l'a entourée, magnifiant la beauté de ce moment et apportant un plaisir visuel sans précédent au public. Il s'agit du « Bullet Time » olympique qui fait l'objet de vives discussions sur Internet, et la technologie vient du cloud chinois Alibaba. (Photo : un test du système de relecture multi-objectifs a été réalisé lors des tours de qualification des Jeux olympiques de Paris) "Bullet Time" couvre 21 événements Selon le service de diffusion olympique (ci-après dénommé OBS), les Jeux olympiques de Paris utilisent une nouvelle technologie de diffusion. amélioré par l'IA chinoise Alibaba Cloud
- IA 769 2024-08-01 20:02:02
-
- Le nouveau travail de CMU et Tsinghua : laissez LLM synthétiser les données pour apprendre par lui-même, et l'exécution de tâches spécifiques est également grandement améliorée.
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les principaux auteurs de cet article sont issus de l'Université Tsinghua et de l'Université Carnegie Mellon (CMU). Ensemble, ils sont Zhao Chenyang, diplômé de premier cycle du département d'informatique de l'université Tsinghua, et Jia Xueying, étudiante en maîtrise de l'université Carnegie Mellon. Bien que les modèles linguistiques à grande échelle (LLM) soient utilisés dans de nombreuses tâches de traitement du langage naturel
- IA 1156 2024-08-01 18:29:41
-
- Les articles arXiv peuvent être publiés sous forme de 'barrage', la plateforme de discussion alphaXiv de Stanford est en ligne, LeCun l'aime
- acclamations! Qu’est-ce que ça fait lorsqu’une discussion sur papier se résume à des mots ? Récemment, des étudiants de l'Université de Stanford ont créé alphaXiv, un forum de discussion ouvert pour les articles arXiv qui permet de publier des questions et des commentaires directement sur n'importe quel article arXiv. Lien du site Web : https://alphaxiv.org/ En fait, il n'est pas nécessaire de visiter spécifiquement ce site Web. Il suffit de remplacer arXiv dans n'importe quelle URL par alphaXiv pour ouvrir directement l'article correspondant sur le forum alphaXiv : vous pouvez localiser avec précision les paragraphes dans. l'article, Phrase : dans la zone de discussion sur la droite, les utilisateurs peuvent poser des questions à l'auteur sur les idées et les détails de l'article. Par exemple, ils peuvent également commenter le contenu de l'article, tels que : "Donné à".
- IA 937 2024-08-01 17:18:13