localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA

  • Le nouveau travail de LeCun : modèle du monde en couches, contrôle de robot humanoïde basé sur les données
    Le nouveau travail de LeCun : modèle du monde en couches, contrôle de robot humanoïde basé sur les données
    Avec de grands modèles comme bénédictions en matière d’intelligence, les robots humanoïdes sont devenus une nouvelle tendance. Les robots des films de science-fiction qui « peuvent dire que je ne suis pas un être humain » semblent se rapprocher. Cependant, penser et agir comme des humains reste un problème d’ingénierie difficile pour les robots, en particulier les robots humanoïdes. En prenant comme exemple un simple apprentissage de la marche, l'utilisation de l'apprentissage par renforcement pour s'entraîner peut évoluer vers ce qui suit : Il n'y a en principe aucun problème (suite au mécanisme de récompense), et l'objectif de monter les escaliers a été atteint. est relativement abstrait et différent de la plupart des êtres humains. Les modèles de comportement peuvent être différents. La raison pour laquelle les robots ont du mal à agir « naturellement » comme les humains est due à la nature de grande dimension de l'espace d'observation et d'action, ainsi qu'à l'instabilité inhérente à la forme bipède. À cet égard, LeCun a participé à
    IA 1090 2024-06-13 11:37:17
  • Bonne nouvelle dans le domaine de la génération d'actifs 3D : les équipes de l'Institut d'automatisation et de l'Université des postes et télécommunications de Pékin créent conjointement un nouveau paradigme de génération de matériaux
    Bonne nouvelle dans le domaine de la génération d'actifs 3D : les équipes de l'Institut d'automatisation et de l'Université des postes et télécommunications de Pékin créent conjointement un nouveau paradigme de génération de matériaux
    La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com À l'ère numérique d'aujourd'hui, les actifs 3D jouent un rôle important dans la construction du métaverse, la réalisation de jumeaux numériques et l'application de la réalité virtuelle et de la réalité augmentée, favorisant la technologie. innovation et amélioration de l’expérience utilisateur. Les méthodes existantes de génération d'actifs 3D exploitent souvent des modèles génératifs
    IA 899 2024-06-13 11:09:54
  • En 18 mois, l'équipe OpenAI a développé GPT-4o
    En 18 mois, l'équipe OpenAI a développé GPT-4o
    Ultraman : Sans sa vision, son talent, sa conviction et sa détermination (de Prafulla Dhariwal), il n'y aurait pas de GPT-4o. "GPT-4o n'aurait pas été possible sans la vision, le talent, la conviction et la détermination à long terme de @prafdhar. Ce sont ces efforts (et le travail de beaucoup d'autres) qui ont conduit à ce que j'espère être une révolution dans le monde. façon dont les ordinateurs sont utilisés. » Deux jours après qu'OpenAI a publié son modèle phare de nouvelle génération, le GPT-4o, le PDG d'OpenAI, Altman, a commenté l'une des personnes impliquées dans le projet. Après 18 mois de travail avec plusieurs équipes d'OpenAI, le co-fondateur Greg Brockman a déclaré : « GPT-4o est le résultat des efforts de toute l'équipe.
    IA 718 2024-06-13 10:33:27
  • Les scientifiques utilisent GenAI pour découvrir de nouvelles connaissances en physique
    Les scientifiques utilisent GenAI pour découvrir de nouvelles connaissances en physique
    Avec l'aide du MIT et de l'Université de Bâle en Suisse, les chercheurs ont développé un nouveau cadre d'apprentissage automatique (ML) qui peut aider à découvrir de nouvelles connaissances sur la science des matériaux. Les résultats de cette étude sont publiés dans Physical Review Letters. Cette recherche utilise une approche basée sur un réseau neuronal pour prédire et optimiser rapidement les propriétés et caractéristiques des matériaux en analysant de grandes quantités de données sur les matériaux. Ce framework GenAI est hautement automatisé et efficace et peut contribuer à accélérer les progrès de la recherche sur les matériaux. Les chercheurs affirment que leur cadre pourrait être appliqué à diverses applications. Lorsque l’eau passe de liquide à solide, elle subit d’importantes propriétés de transformation, telles que le volume et la densité. Les changements de phase dans l'eau sont si courants que nous n'y pensons même pas sérieusement, mais il s'agit d'un système physique complexe. pendant le changement de phase
    IA 438 2024-06-13 10:32:22
  • Le modèle mondial se propage aussi ! L'agent formé s'avère plutôt bon
    Le modèle mondial se propage aussi ! L'agent formé s'avère plutôt bon
    Les modèles mondiaux offrent un moyen de former des agents d’apprentissage par renforcement de manière sûre et efficace en matière d’échantillonnage. Récemment, les modèles mondiaux ont principalement fonctionné sur des séquences de variables latentes discrètes pour simuler la dynamique environnementale. Cependant, cette méthode de compression en représentations discrètes compactes peut ignorer les détails visuels importants pour l’apprentissage par renforcement. D’un autre côté, les modèles de diffusion sont devenus la méthode dominante de génération d’images, posant des défis aux modèles latents discrets. Encouragés par ce changement de paradigme, des chercheurs de l'Université de Genève, de l'Université d'Édimbourg et de Microsoft Research ont proposé conjointement un agent d'apprentissage par renforcement formé selon le modèle mondial de diffusion DIAMOND (DIffusionAsaModelOfeNvironmentDreams). Adresse papier : https :
    IA 429 2024-06-13 10:12:24
  • L'ordre du jour de la conférence Zhiyuan 2024 révélé : réunion d'échange sur le développement des talents en intelligence artificielle
    L'ordre du jour de la conférence Zhiyuan 2024 révélé : réunion d'échange sur le développement des talents en intelligence artificielle
    Du 14 au 15 juin 2024, la 6e conférence sur les sources intelligentes de Pékin se tiendra dans une combinaison de hors ligne et en ligne. Le lieu hors ligne sera situé au centre de conférence national indépendant de la zone de démonstration de l'innovation de Zhongguancun. La conférence Zhiyuan 2024 rassemble une fois de plus des chercheurs exceptionnels de l'année avec une perspective mondiale pour échanger de nouvelles idées, explorer de nouvelles idées et explorer de nouvelles frontières. Les canaux d'inscription sont désormais officiellement ouverts. Réunion d'échange sur le développement des talents en intelligence artificielle丨Dans l'après-midi du 14 juin, la conférence Zhiyuan de Pékin 2024 tiendra une réunion d'échange à huis clos sur le développement des talents en intelligence artificielle. Nous vous invitons sincèrement à discuter des questions clés dans le développement des talents en intelligence artificielle. Le forum de discussion se concentrera sur les domaines de l'intelligence, du langage naturel, de la vision industrielle, de la multimodalité, de l'apprentissage par renforcement, de l'IA pour la science et d'autres orientations pour vous fournir
    IA 1276 2024-06-13 10:00:59
  • HKU Byte propose un nouveau paradigme de grands modèles multimodaux, simulant d'abord la perception humaine puis la cognition, pour localiser avec précision les objets dans l'image
    HKU Byte propose un nouveau paradigme de grands modèles multimodaux, simulant d'abord la perception humaine puis la cognition, pour localiser avec précision les objets dans l'image
    Actuellement, les grands modèles multimodaux (MLLM) ont démontré de fortes capacités de compréhension cognitive sur plusieurs tâches visuelles. Cependant, la plupart des grands modèles multimodaux se limitent à une compréhension unidirectionnelle de l’image, ce qui rend difficile la correspondance du contenu compris avec l’image. Par exemple, le modèle peut facilement déterminer quels objets se trouvent dans l’image, mais il ne peut pas les identifier avec précision. Le manque de capacités de positionnement limite directement l’application des grands modèles multimodaux dans des domaines en aval tels que l’édition d’images, la conduite autonome et le contrôle des robots. En réponse à ce problème, des chercheurs de l'Université de Hong Kong et l'équipe de commercialisation de ByteDance ont proposé un nouveau paradigme, Groma, qui utilise le codage d'images régional pour améliorer les capacités de positionnement perceptuel des grands modèles multimodaux. Après avoir intégré le positionnement, Groma peut directement associer le contenu du texte et les zones d'image à afficher
    IA 814 2024-06-12 22:18:00
  • L'Université Tsinghua et Zhipu AI open source GLM-4 : lancent une nouvelle révolution dans le traitement du langage naturel
    L'Université Tsinghua et Zhipu AI open source GLM-4 : lancent une nouvelle révolution dans le traitement du langage naturel
    Depuis le lancement du ChatGLM-6B le 14 mars 2023, les modèles de la série GLM ont reçu une large attention et une grande reconnaissance. Surtout après que ChatGLM3-6B soit open source, les développeurs sont pleins d'attentes pour le modèle de quatrième génération lancé par Zhipu AI. Cette attente a finalement été pleinement satisfaite avec la sortie du GLM-4-9B. La naissance du GLM-4-9B Afin de donner aux petits modèles (10B et moins) des capacités plus puissantes, l'équipe technique de GLM a lancé ce nouveau modèle open source de la série GLM de quatrième génération : GLM-4-9B après près de six mois de exploration. Ce modèle compresse considérablement la taille du modèle tout en garantissant la précision, et offre une vitesse d'inférence plus rapide et une efficacité plus élevée. L’exploration de l’équipe technique du GLM n’a pas
    IA 1050 2024-06-12 20:38:02
  • 7B ? 13B ? 175B ? Interpréter les paramètres des grands modèles
    7B ? 13B ? 175B ? Interpréter les paramètres des grands modèles
    Il existe également des modèles grands et petits, et leur taille est mesurée par le nombre de paramètres. GPT-3 possède 17,5 milliards de paramètres, et Grok-1 est encore plus impressionnant, avec 31,4 milliards de paramètres. Bien sûr, il en existe aussi des plus minces comme Llama, dont le nombre de paramètres n'est compris qu'entre 7 et 70 milliards. Le 70B mentionné ici ne fait peut-être pas référence à la quantité de données d'entraînement, mais aux paramètres densément regroupés dans le modèle. Ces paramètres sont comme de petites « cellules cérébrales ». Plus ils sont nombreux, plus le modèle peut être intelligent et mieux il peut comprendre les relations complexes entre les données. Grâce à ces « cellules cérébrales », les modèles peuvent être plus performants dans leurs tâches. Cependant, ces paramètres peuvent souvent poser des problèmes, en particulier dans les modèles à grande échelle. Ces « cellules cérébrales » sont
    IA 834 2024-06-12 20:04:15
  • YoloCS : réduisez efficacement la complexité spatiale des cartes de fonctionnalités
    YoloCS : réduisez efficacement la complexité spatiale des cartes de fonctionnalités
    Adresse de l'article : YOLOCS : ObjectDetectionbasedonDenseChannelCompressionforFeatureSpatialSolidification (arxiv.org)01 Présentation Dans le partage d'aujourd'hui, les chercheurs ont examiné la corrélation entre les caractéristiques du canal et les noyaux de convolution lors de la purification des caractéristiques et de la rétropropagation du gradient, en se concentrant sur le front-end au sein du réseau. Par conséquent, les chercheurs ont proposé une méthode de solidification de l’espace de fonctionnalités appelée compression de canal dense. Sur la base des concepts de base de la méthode, deux modules innovants pour les réseaux de base et de tête sont introduits : la compression à canal dense (DCFS) pour la solidification de l'espace des fonctionnalités et la compression asymétrique à plusieurs étages.
    IA 455 2024-06-12 17:49:26
  • Meta lance « Chameleon » pour défier GPT-4o, les paramètres 34B mènent la révolution multimodale ! La formation de 10 000 milliards de jetons actualise SOTA
    Meta lance « Chameleon » pour défier GPT-4o, les paramètres 34B mènent la révolution multimodale ! La formation de 10 000 milliards de jetons actualise SOTA
    L'émergence de GPT-4o a une fois de plus créé un nouveau paradigme pour le développement de modèles multimodaux ! Pourquoi dites vous cela? OpenAI l'appelle « le premier modèle multimodal « natif » », ce qui signifie que GPT-4o est différent de tous les modèles précédents. Les modèles de base multimodaux traditionnels utilisent généralement un « encodeur » ou un « décodeur » spécifique pour chaque modalité afin de séparer les différentes modalités. Cependant, cette approche limite la capacité du modèle à fusionner efficacement les informations intermodales. GPT-4o est le premier modèle formé de bout en bout pouvant couvrir les modes texte, visuel et audio, avec toutes les entrées et sorties traitées par un seul réseau neuronal. Et maintenant, le premier modèle de l'industrie qui ose défier GPT-4o est apparu ! Récemment, du groupe Meta
    IA 928 2024-06-12 13:18:58
  • Vitesse de génération 3 fois supérieure et coûts de mémoire réduits, un cadre de décodage efficace qui surpasse Medusa2 est enfin là
    Vitesse de génération 3 fois supérieure et coûts de mémoire réduits, un cadre de décodage efficace qui surpasse Medusa2 est enfin là
    Décodez efficacement les séquences de jetons n, cadre de décodage CLLM + Jacobi. Traditionnellement, les grands modèles de langage (LLM) sont considérés comme des décodeurs séquentiels, décodant chaque jeton un par un. Une équipe de recherche de l'Université Jiao Tong de Shanghai et de l'Université de Californie montre que les LLM pré-entraînés peuvent être facilement enseignés pour devenir des décodeurs parallèles efficaces et présente une nouvelle famille de décodeurs parallèles appelés Consistent Large Language Models (CLLM), capables de réduire la latence d'inférence. en décodant efficacement une séquence de n jetons à chaque étape d'inférence. Dans cet article, la recherche montre que « l’imitation du processus cognitif que les humains utilisent pour exprimer des expressions mot à mot après avoir formé des phrases complètes dans leur tête peut être efficacement apprise en ajustant simplement les LLM pré-entraînés.
    IA 1006 2024-06-12 11:55:28
  • La première action d'Ilya après avoir quitté son emploi : il a aimé ce journal et les internautes se sont précipités pour le lire
    La première action d'Ilya après avoir quitté son emploi : il a aimé ce journal et les internautes se sont précipités pour le lire
    Depuis qu'Ilya Sutskever a officiellement annoncé sa démission d'OpenAI, sa prochaine décision est devenue le centre de l'attention de tous. Certaines personnes prêtaient même une attention particulière à chacun de ses mouvements. Non, Ilya a juste aimé ❤️ un nouvel article - les internautes ont sauté dessus : l'article vient du MIT, l'auteur a avancé une hypothèse, résumée en une phrase comme ceci : les réseaux neuronaux formés sur différentes données et modalités avec des objectifs différents ont tendance à former un modèle statistique partagé du monde réel dans leur espace de représentation. Ils ont nommé cette spéculation l'hypothèse de la représentation platonicienne, en référence à l'allégorie de la grotte de Platon et à ses idées sur la nature de la réalité idéale. La sélection d'Ilya est toujours garantie. Certains internautes l'ont qualifiée de meilleure qu'ils aient vue cette année après l'avoir regardée.
    IA 715 2024-06-12 11:22:14
  • GraphRAG amélioré pour la récupération de graphes de connaissances (implémenté sur la base du code Neo4j)
    GraphRAG amélioré pour la récupération de graphes de connaissances (implémenté sur la base du code Neo4j)
    La génération améliorée de récupération de graphiques (GraphRAG) devient progressivement populaire et est devenue un complément puissant aux méthodes de recherche vectorielles traditionnelles. Cette méthode tire parti des caractéristiques structurelles des bases de données graphiques pour organiser les données sous forme de nœuds et de relations, améliorant ainsi la profondeur et la pertinence contextuelle des informations récupérées. Les graphiques présentent un avantage naturel dans la représentation et le stockage d’informations diverses et interdépendantes, et peuvent facilement capturer des relations et des propriétés complexes entre différents types de données. Les bases de données vectorielles sont incapables de gérer ce type d'informations structurées et se concentrent davantage sur le traitement de données non structurées représentées par des vecteurs de grande dimension. Dans les applications RAG, la combinaison de données graphiques structurées et de recherche de vecteurs de texte non structuré nous permet de profiter des avantages des deux en même temps, ce dont discutera cet article. structure
    IA 1487 2024-06-12 10:32:28
  • Avec plus de 10 000 bibliothèques de codes Github populaires intégrées, Baidu a officiellement publié Comate Code Knowledge Enhancement 2.0.
    Avec plus de 10 000 bibliothèques de codes Github populaires intégrées, Baidu a officiellement publié Comate Code Knowledge Enhancement 2.0.
    Le 18 mai 2019, le 7e Forum du sommet de l'élite des technologies Internet de l'iTechClub de Chine du Nord a eu lieu. Le directeur du département de performance technique de Baidu a prononcé un discours sur « Vers un nouveau paradigme de R&D native en IA pour la collaboration homme-machine ». Il a publié la dernière réalisation de l'assistant de code intelligent Comate de Baidu - Comate Code Knowledge Enhancement 2.0. Il s'agit du premier assistant de code intelligent en Chine qui prend en charge la récupération en temps réel. Il intègre plus de 10 000 bibliothèques de codes populaires sur Github. de grands avantages pour les développeurs du monde entier. Une expérience de programmation sans précédent. L'un des points forts de cette conférence, Comate Code Knowledge Enhancement 2.0, a reçu une grande attention de la part des participants. L'assistant de code intelligent Comate est un outil de complétion de code intelligent et
    IA 1086 2024-06-11 22:45:15

Recommandations d'outils

Code de contact du formulaire de message d'entreprise jQuery

Le code de contact du formulaire de message d'entreprise jQuery est un formulaire de message d'entreprise simple et pratique et le code de la page d'introduction contactez-nous.

Effets de lecture de boîte à musique HTML5 MP3

L'effet spécial de lecture de boîte à musique HTML5 MP3 est un lecteur de musique MP3 basé sur HTML5 + CSS3 pour créer de jolies émoticônes de boîte à musique et cliquer sur le bouton de commutation.

Effets spéciaux du menu de navigation d'animation de particules cool HTML5

L'effet de menu de navigation d'animation de particules cool HTML5 est un effet spécial qui change de couleur lorsque le menu de navigation est survolé par la souris.

Code d'édition par glisser-déposer du formulaire visuel jQuery

Le code d'édition par glisser-déposer du formulaire visuel jQuery est un formulaire visuel basé sur jQuery et le framework bootstrap.

Modèle Web de fournisseur de fruits et légumes biologiques Bootstrap5

Un modèle Web de fournisseur de fruits et légumes biologiques-Bootstrap5
Modèle d'amorçage
2023-02-03

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus
modèle de back-end
2023-02-02

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5
Modèle d'amorçage
2023-02-02

Modèle Web d'informations de CV simples Bootstrap4

Modèle Web d'informations de CV simples Bootstrap4
Modèle d'amorçage
2023-02-02

Matériau vectoriel d'éléments d'été mignons (EPS+PNG)

Il s'agit d'un joli matériau vectoriel d'éléments d'été, comprenant le soleil, un chapeau de soleil, un cocotier, un bikini, un avion, une pastèque, une crème glacée, une boisson fraîche, une bouée, des tongs, un ananas, une conque, une coquille, une étoile de mer, un crabe. , Citrons, crème solaire, lunettes de soleil, etc., le matériel est fourni aux formats EPS et PNG, y compris des aperçus JPG.
Matériau PNG
2024-05-09

Matériel vectoriel de quatre badges de graduation rouges 2023 (AI+EPS+PNG)

Il s'agit d'un matériau vectoriel de badge de remise des diplômes rouge 2023, quatre au total, disponible aux formats AI, EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-29

Oiseau chantant et chariot rempli de fleurs design matériel vectoriel de bannière de printemps (AI + EPS)

Il s'agit d'un matériau vectoriel de bannière printanière conçu avec des oiseaux chanteurs et un chariot rempli de fleurs. Il est disponible aux formats AI et EPS, y compris l'aperçu JPG.
image de bannière
2024-02-29

Matériau vectoriel de chapeau de graduation doré (EPS+PNG)

Il s'agit d'un matériau vectoriel de casquette de graduation dorée, disponible aux formats EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-27

Modèle de site Web d'entreprise de services de nettoyage et de réparation de décoration intérieure

Le modèle de site Web d'entreprise de services de nettoyage et d'entretien de décoration d'intérieur est un modèle de site Web à télécharger adapté aux sites Web promotionnels qui proposent des services de décoration, de nettoyage, d'entretien et d'autres organisations de services. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-05-09

Modèle de page de guide de CV personnel aux couleurs fraîches

Le modèle de page de guide de CV de candidature personnelle de correspondance de couleurs fraîches est un téléchargement de modèle Web de page de guide d'affichage de travail de CV de recherche d'emploi personnel adapté au style de correspondance de couleurs fraîches. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-29

Modèle Web de CV de travail créatif de concepteur

Le modèle Web de CV de travail créatif de concepteur est un modèle Web téléchargeable pour l'affichage de CV personnels adapté à divers postes de concepteur. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28

Modèle de site Web d'entreprise de construction d'ingénierie moderne

Le modèle de site Web d'entreprise d'ingénierie et de construction moderne est un modèle de site Web téléchargeable adapté à la promotion du secteur des services d'ingénierie et de construction. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28