localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- Du RLHF au DPO en passant par TDPO, les algorithmes d'alignement des grands modèles sont déjà « au niveau des jetons »
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Dans le processus de développement de l'intelligence artificielle, le contrôle et le guidage des grands modèles de langage (LLM) ont toujours été l'un des principaux défis, visant à garantir que ces modèles sont à la fois puissant et sûr au service de la société humaine. Les premiers efforts se sont concentrés sur les méthodes d’apprentissage par renforcement par feedback humain (RL
- IA 870 2024-06-24 15:04:43
-
- Pourquoi avez-vous abandonné LangChain ?
- Peut-être que dès sa naissance, LangChain était destiné à être un produit à la réputation polarisante. Ceux qui sont optimistes à propos de LangChain apprécient ses riches outils et composants ainsi que sa facilité d'intégration, tandis que ceux qui ne sont pas optimistes à propos de LangChain pensent qu'il est voué à l'échec - dans cette ère de changement technologique rapide, il n'est tout simplement pas possible de tout construire. avec LangChain. Encore plus exagéré : « Dans mon travail de consultant, je consacre 70 % de mon énergie à convaincre les gens de ne pas utiliser langchain ou lamaindex. Cela résout 90 % de leurs problèmes. Récemment, une plainte contre LangChain est redevenue un sujet brûlant. Thème de discussion : l'auteur. FabianBoth est un outil de test d'IA O
- IA 1213 2024-06-24 14:20:32
-
- ICML 2024 | Pollution des fonctionnalités : les réseaux de neurones apprennent des fonctionnalités non pertinentes et ne parviennent pas à généraliser
- Titre de l'article : FeatureContamination : NeuralNetworksLearnUncorratedFeaturesandFailtoGeneralize Lien de l'article : https://arxiv.org/pdf/2406.03345 Lien de code : https://github.com/trzhang0116/feature-contamination Avec les réalisations des grands modèles représentés par GPT ces dernières années Un énorme succès, le paradigme d'apprentissage automatique du réseau neuronal profond + SGD + mise à l'échelle a une fois de plus prouvé sa domination dans le domaine de l'IA. pourquoi basé sur
- IA 932 2024-06-24 14:17:11
-
- CVPR 24|ETH Zurich et autres équipes : Redéfinissant la tâche de segmentation 3D de petits échantillons, le nouveau benchmark ouvre un large potentiel d'amélioration !
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Le premier auteur de cet article, An Zhaochong, étudie actuellement pour un doctorat à l'Université de Copenhague, sous la direction de Serge Belongie. Il est titulaire d'un master à l'École polytechnique fédérale de Zurich (ETHZurich). Au cours de son master, il a travaillé sous la direction de son mentor Luc Van.
- IA 920 2024-06-24 14:05:51
-
- Le nouveau tokenizer d'image de ByteDouBao : seuls 32 jetons sont nécessaires pour générer une image et la vitesse est augmentée jusqu'à 410 fois.
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. E-mail de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Dans le développement rapide de modèles génératifs, ImageTokenization joue un rôle très important, comme le VAE sur lequel s'appuie Diffusion ou le VQGAN sur lequel s'appuie Transformer. Ces Tokes
- IA 1256 2024-06-24 14:03:31
-
- Huawei Cloud utilise le grand modèle Pangu pour remodeler les services et ModelArts Studio est entièrement mis à niveau
- La conférence des développeurs Huawei 2024 se tiendra à Dongguan. Lors de la conférence, Huawei a publié les dernières avancées en matière d'HarmonyOSNext, de Pangu Model 5.0 et d'autres aspects, et a présenté une série de cas d'application de technologies avancées d'IA. Zhang Yuxin, CTO de Huawei Cloud, a déclaré : « Sur la base des capacités du modèle Pangu, Huawei Cloud a remodelé une série de services cloud et créé un cloud AINatif pour aider à rendre des milliers d'industries intelligentes. Selon les rapports, Huawei Cloud combine. le modèle Pangu avec Huawei En combinant les données et l'expérience accumulées dans divers domaines tels que la recherche et le développement de produits, la gouvernance des données, la protection de la sécurité, ainsi que l'exploitation et la maintenance commerciales, nous avons « sauté notre propre parachute » et l'avons appliqué à Huawei Cloud CodeArts, DataArts, MetaStudio, GaussDB et sécurité du cloud.
- IA 454 2024-06-22 11:55:38
-
- Examen de première main de Claude 3.5 : est-il vraiment meilleur que GPT-4o pour jouer des tours, consulter un médecin, jouer des tours et résoudre des problèmes de mathématiques ?
- Rédacteur du reportage sur le pouvoir des machines : Yang Wen joue des tours, voit des médecins, joue des tours et résout des problèmes de mathématiques La capacité du « nouveau roi » Claude 3.5 est-elle vraiment si mystérieuse ? Ça vient, ça vient, ça vient avec Claude3.5Sonnet ! Après être resté en sommeil pendant trois mois, hier soir, le « puissant rival » d'OpenAI, Anthropic, a lancé un modèle de nouvelle génération : Claude3.5Sonnet ! Quelle est la particularité de ce grand modèle ? Premièrement, il comprend mieux les nuances, l’humour et les instructions complexes, et le ton d’écriture est plus naturel et accessible. Il s’agit également du modèle visuel le plus puissant d’Anthropic, excellant dans des tâches telles que l’interprétation de tableaux, de graphiques ou la transcription de texte à partir d’images imparfaites. De plus, il est utilisé dans le raisonnement, la compréhension écrite
- IA 1172 2024-06-22 07:46:19
-
- Couvrant les tâches de texte, de positionnement et de segmentation, Zhiyuan et les Chinois de Hong Kong ont proposé conjointement le premier grand modèle médical multimodal 3D multifonctionnel
- Auteur | Rédacteur Bai Fan, Université chinoise de Hong Kong | ScienceAI Récemment, l'Université chinoise de Hong Kong et Zhiyuan ont proposé conjointement la série de travaux M3D, comprenant M3D-Data, M3D-LaMed et M3D-Bench, pour promouvoir les images médicales 3D. de tous les aspects des ensembles de données, des modèles et des évaluations. Développement d'analyses. (1) M3D-Data est actuellement le plus grand ensemble de données d'images médicales 3D, comprenant M3D-Cap (120 000 paires d'images et de textes 3D), M3D-VQA (510 000 paires de questions et réponses), M3D-Seg (150 000 paires de masques 3D), M3D-RefSeg ( Segmentation d'inférence 3K) au total quatre sous-ensembles de données. (2) M3D-LaMed est actuellement le grand modèle médical multimodal 3D le plus polyvalent pouvant
- IA 813 2024-06-22 07:16:49
-
- Qu'il s'agisse d'une vidéo réelle ou d'une vidéo IA, « Mosca » peut reconstruire et restaurer des scènes dynamiques 4D.
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Lei Jiahui est doctorant au Département d'informatique de l'Université de Pennsylvanie (2020-présent). Son directeur de recherche est le professeur KostasDaniilidis. modélisation et représentation de la géométrie de scènes dynamiques en quatre dimensions. Il est en vision par ordinateur
- IA 808 2024-06-22 07:09:52
-
- Identifiez automatiquement les meilleures molécules et réduisez les coûts de synthèse. Le MIT développe un cadre d'algorithme de prise de décision en matière de conception moléculaire.
- Éditeur | L’utilisation de Ziluo AI pour rationaliser la découverte de médicaments explose. Ciblez des milliards de molécules candidates pour détecter celles qui pourraient posséder les propriétés nécessaires au développement de nouveaux médicaments. Il y a tellement de variables à prendre en compte, depuis le prix des matériaux jusqu’au risque d’erreur, qu’évaluer les coûts de synthèse des meilleures molécules candidates n’est pas une tâche facile, même si les scientifiques utilisent l’IA. Ici, les chercheurs du MIT ont développé SPARROW, un cadre d'algorithme de prise de décision quantitative, pour identifier automatiquement les meilleurs candidats moléculaires, minimisant ainsi les coûts de synthèse tout en maximisant la probabilité que les candidats possèdent les propriétés souhaitées. L’algorithme a également identifié les matériaux et les étapes expérimentales nécessaires à la synthèse de ces molécules. SPARROW prend en compte le coût de synthèse d'un lot de molécules à la fois, puisque plusieurs molécules candidates sont souvent disponibles
- IA 1240 2024-06-22 06:43:34
-
- Inscription au Forum WAIC | Rassemblant de nombreuses entreprises publiques centrales et sociétés d'IA pour discuter du développement intégré des industries
- En tant que moteur d’une nouvelle productivité, l’intelligence artificielle s’intègre rapidement dans des milliers d’industries. Le 5 mars, en présentant les tâches du gouvernement cette année dans le rapport d'activité du gouvernement, le Premier ministre Li Qiang a proposé d'approfondir les applications de recherche et développement du big data, de l'intelligence artificielle, etc., de mener l'action « intelligence artificielle + » et créer un pôle industriel numérique compétitif à l’échelle internationale. Depuis lors, la stratégie de l’intelligence artificielle au service du développement industriel s’est accélérée. Afin de faciliter davantage le processus « d'intelligence artificielle + », de présenter et de partager les expériences d'explorateurs à succès et de faciliter la coopération entre l'offre et la demande dans le domaine de l'intelligence artificielle, ce site a hébergé l'expérience clé du ministère de l'Industrie et Technologie de l'information pour l'évaluation des applications de scénarios d'intelligence artificielle et des systèmes intelligents. "2024WAIC Artificial Intelligence Empowers Industrial Integration Development" co-organisé par le Bureau.
- IA 1255 2024-06-22 04:59:29
-
- Xiaoice et ShiMeta co-créent la solution humaine numérique ShiMeta : avec la bénédiction des grands modèles, chaque terminal grand écran devient un nouveau support interactif
- Le 21 juin 2024, Xiaoice et ShiMeta, l'une des principales sociétés d'AIoT, ont annoncé une coopération stratégique pour lancer conjointement la solution humaine numérique ShiMeta. Les deux parties créent conjointement diverses formes de terminaux interactifs intelligents et humains numériques sur grand écran, intégrant le grand modèle d'IA et la technologie humaine numérique de Xiaoice au riche écosystème commercial matériel de Shimatel, permettant aux humains numériques d'entrer dans divers scénarios industriels et de servir Baiye en injectant une nouvelle productivité. améliore l'expérience utilisateur et l'efficacité du service, et apporte des changements plus intelligents. XiaoIce × Simatech : la riche solution d'écosystème commercial matériel combine les grands modèles de Xiaoice et les technologies humaines numériques avancées telles que le rendu des réseaux neuronaux et la parole super naturelle avec les cartes mères hautes performances, les caméras haute définition, les réseaux de microphones, les plates-formes de gestion d'équipement de Simatech, etc. -une intégration en profondeur a été réalisée pour réaliser des terminaux grand écran
- IA 679 2024-06-22 02:22:30
-
- L'apprentissage automatique peut-il se faire uniquement en parlant sans effectuer de calculs numériques ? Un nouveau paradigme de ML basé sur le langage naturel arrive
- La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com L'auteur de cet article, Xiao Zhenzhong, est doctorant à l'Institut Max Planck pour les systèmes intelligents et à l'Université de Tübingen en Allemagne, Robert Bamler est professeur de machine. étudiant à l'Université de Tübingen, Bernhard Schölkopf était Max Planck-.
- IA 500 2024-06-22 02:06:40
-
- Battez GPT-4o ! Le nouveau roi Claude 3.5 Sonnet est là, disponible directement gratuitement
- De nos jours, le domaine des grands modèles est encore plus passionnant ! À l’avant, OpenAI a lancé GPT4o et contrôlait l’ensemble du domaine. À l’arrière, il a été dépassé par son plus grand concurrent Anthropic. Anthropic vient de sortir un nouveau grand modèle Claude3.5Sonnet, considéré comme le modèle le plus intelligent à ce jour. Selon certaines informations, Claude3.5Sonnet est la première version de la prochaine série Claude3.5 d'Anthropic. Ce modèle a amélioré le niveau d'intelligence de l'ensemble du domaine, surpassant les grands modèles concurrents et le Claude3Opus le plus puissant de son prédécesseur dans la plupart des évaluations de référence. Dans le même temps, la vitesse de fonctionnement et le coût sont équivalents à ceux de sa génération précédente Claude3Sonnet. Adresse : ht
- IA 1246 2024-06-22 01:08:30
-
- Luma et Runway se relaient pour entrer en scène, et la génération vidéo atteint de nouveaux sommets. Sora peut-il encore dominer ? Venez sur ce forum de génération vidéo WAIC pour trouver des réponses
- Lorsque PIKA est sorti en 2023, Musk a conclu que 2024 serait la première année des « films sur l’intelligence artificielle ». En début d'année, Sora a fait des débuts époustouflants, tuant tout le monde. Puis Stable Video Diffusion, LTX Studio et Google Veo se sont relayés pour exploser, et puis plus récemment, Keling, Luma et Runway se sont affrontés... En seulement la moitié. En un an, de nombreuses applications vidéo IA ont vu le jour, non seulement elles poussent la technologie de génération vidéo vers de nouveaux sommets, élargissent le champ d'application de la vidéo IA et offrent plus de possibilités à l'avenir. De nos jours, le développement de capacités multimodales est devenu la tendance générale des applications AIGC avec l'amélioration continue de la technologie de génération vidéo et le nombre croissant d'orientations industrielles AI+.
- IA 1254 2024-06-21 22:00:23