localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA

  • Comment OctopusV3, avec moins d'un milliard de paramètres, peut-il se comparer à GPT-4V et GPT-4 ?
    Comment OctopusV3, avec moins d'un milliard de paramètres, peut-il se comparer à GPT-4V et GPT-4 ?
    La caractéristique des systèmes d’IA multimodaux est qu’ils peuvent traiter et apprendre différents types de données, notamment le langage naturel, la vision, l’audio, etc., pour guider leurs décisions comportementales. Récemment, la recherche sur l'intégration de données visuelles dans de grands modèles de langage (tels que GPT-4V) a réalisé des progrès importants, mais la manière de convertir efficacement les informations d'image en opérations exécutables pour les systèmes d'IA reste confrontée à des défis. Afin de réaliser la transformation des informations d'image, une méthode courante consiste à convertir les données d'image en descriptions textuelles correspondantes, puis le système d'IA fonctionne sur la base des descriptions. Cela peut être fait en effectuant un apprentissage supervisé sur des ensembles de données d'images existants, permettant au système d'IA d'apprendre automatiquement la relation de mappage image-texte. De plus, les méthodes d’apprentissage par renforcement peuvent également être utilisées pour apprendre à prendre des décisions basées sur des informations d’image en interagissant avec l’environnement. un autre
    IA 631 2024-05-02 16:01:01
  • Dans 12 tâches de compréhension vidéo, Mamba a vaincu Transformer pour la première fois
    Dans 12 tâches de compréhension vidéo, Mamba a vaincu Transformer pour la première fois
    Ce site publie des chroniques au contenu académique et technique. Ces dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com. Explorant un nouveau domaine de compréhension vidéo, le modèle Mamba ouvre une nouvelle tendance dans la recherche sur la vision par ordinateur ! Les limites de l'architecture traditionnelle ont été brisées. Le modèle d'espace d'états Mamba a apporté des changements révolutionnaires dans le domaine de la compréhension vidéo grâce à ses avantages uniques dans le traitement de longues séquences. De l'Université de Nanjing, Shanghai
    IA 1440 2024-05-01 08:20:15
  • Comprendre GraphRAG (1) : les défis de RAG
    Comprendre GraphRAG (1) : les défis de RAG
    RAG (RiskAssessmentGrid) est une méthode qui améliore les grands modèles linguistiques (LLM) existants avec des sources de connaissances externes pour fournir des réponses plus pertinentes sur le plan contextuel. Dans RAG, le composant de récupération obtient des informations supplémentaires, la réponse est basée sur une source spécifique, puis introduit ces informations dans l'invite LLM afin que la réponse du LLM soit basée sur ces informations (phase d'amélioration). Le RAG est plus économique que d’autres techniques telles que le parage. Il présente également l'avantage de réduire les hallucinations en fournissant un contexte supplémentaire basé sur ces informations (étape d'augmentation) - votre RAG devient la méthode de workflow pour les tâches LLM d'aujourd'hui (telles que la recommandation, l'extraction de texte, l'analyse des sentiments, etc.). Si nous décomposons cette idée davantage, en fonction de l'intention de l'utilisateur, nous examinons généralement
    IA 1068 2024-04-30 19:10:01
  • Xiaohongshu a fait se quereller les agents intelligents ! Lancé conjointement avec l'Université de Fudan pour lancer un outil de discussion de groupe exclusif pour les grands modèles
    Xiaohongshu a fait se quereller les agents intelligents ! Lancé conjointement avec l'Université de Fudan pour lancer un outil de discussion de groupe exclusif pour les grands modèles
    La langue n'est pas seulement un tas de mots, mais aussi un carnaval d'émoticônes, une mer de mèmes et un champ de bataille pour les guerriers du clavier (hein ? Qu'est-ce qui ne va pas ?). Comment la langue façonne-t-elle notre comportement social ? Comment notre structure sociale évolue-t-elle grâce à une communication verbale constante ? Récemment, des chercheurs de l'Université Fudan et de Xiaohongshu ont mené des discussions approfondies sur ces questions en introduisant une plateforme de simulation appelée AgentGroupChat. La fonction de discussion de groupe des médias sociaux tels que WhatsApp est l'inspiration de la plateforme AgentGroupChat. Sur la plateforme AgentGroupChat, les agents peuvent simuler divers scénarios de discussion dans des groupes sociaux pour aider les chercheurs à comprendre en profondeur l'impact du langage sur le comportement humain. Devrait
    IA 1173 2024-04-30 18:40:23
  • La version GitHub de Devin est en ligne, vous pouvez développer des applications si vous savez taper, PDG de Microsoft : Redéfinir l'IDE
    La version GitHub de Devin est en ligne, vous pouvez développer des applications si vous savez taper, PDG de Microsoft : Redéfinir l'IDE
    La « version GitHub de Devin » de Microsoft - Copilot WorkSpace, est enfin en ligne ! WorkSpace est un nouvel environnement de développement « Copilot native » qui vise à permettre à tous les développeurs d'utiliser le langage naturel pour transformer les idées qu'ils ont en tête en applications. En d’autres termes, tant que vous avez une idée et savez taper, vous pouvez vous lancer dans le développement de logiciels. Le flux de travail en langage entièrement naturel de WorkSpace lui a également valu le titre de « version GitHub de Devin » décerné par les internautes. Domke, PDG de GitHub, a déclaré que WorkSpace avait dépassé les fonctions originales de Copilot et redéfinirait l'expérience des développeurs. Le PDG de Microsoft, Nadella, a également été mentionné à nouveau
    IA 561 2024-04-30 17:55:24
  • Comment tirer parti de l'intelligence artificielle et de l'apprentissage automatique dans les services Web
    Comment tirer parti de l'intelligence artificielle et de l'apprentissage automatique dans les services Web
    L’intégration de la technologie de l’intelligence artificielle dans divers produits a changé la donne, en particulier dans les systèmes de services réseau. La définition de l'intelligence artificielle s'est élargie pour inclure les heuristiques et les probabilités dans le code de programmation, ouvrant la voie à des capacités de traitement des données et de résolution de problèmes plus efficaces. Le marché du machine learning (ML) est en plein essor à l’échelle mondiale. En 2022, sa valeur sera d'environ 19,2 milliards de dollars. Les experts prédisent que ce chiffre atteindra 225,91 milliards de dollars d’ici 2030. Cet article explore l'impact profond de l'intelligence artificielle et de l'apprentissage automatique (ML) sur les services Web, révélant comment ils révolutionnent la façon dont nous traitons de grandes quantités de données. Au cours des dernières années, la technologie du machine learning a réalisé d’énormes avancées dans divers domaines, notamment dans le traitement des données.
    IA 795 2024-04-30 17:50:01
  • Quel est le potentiel de l'intelligence artificielle quantique ?
    Quel est le potentiel de l'intelligence artificielle quantique ?
    Dans les sables changeants de l’intelligence artificielle (IA), un phénix renaît de ses cendres, ouvrant la voie à une nouvelle ère d’intelligence informatique : la fusion de la physique quantique et de la magie informatique. Attention, lecteurs, c’est la naissance de l’intelligence artificielle quantique, une convergence historique qui redéfinira la trajectoire du progrès technologique tel que nous le connaissons. Comprendre l'IA quantique : le mariage de la mécanique quantique et de l'intelligence artificielle En substance, l'IA quantique est comme une danse entre le royaume éthéré de la physique quantique et la symphonie informatique de l'intelligence artificielle, semblable à une quête entre le mystérieux et l'algorithmique. Contrairement aux ordinateurs traditionnels qui hésitent sur leur chemin binaire, l’IA quantique peut tourner gracieusement sur la scène quantique, exerçant l’attrait mystérieux des qubits, ou qubits. Ces organismes mystérieux rappellent les chats
    IA 463 2024-04-30 17:49:13
  • La plus grande reconstruction de l'histoire de 25km² ! NeRF-XL : Utilisation vraiment efficace de l'entraînement commun multi-cartes !
    La plus grande reconstruction de l'histoire de 25km² ! NeRF-XL : Utilisation vraiment efficace de l'entraînement commun multi-cartes !
    Titre original : NeRF-XL : Scaling NeRFswithMultipleGPUs Lien article : https://research.nvidia.com/labs/toronto-ai/nerfxl/assets/nerfxl.pdf Lien du projet : https://research.nvidia.com/labs/ toronto -ai/nerfxl/Affiliation de l'auteur : NVIDIA University of California, Berkeley Idée d'article : Cet article propose NeRF-XL, une méthode de principe pour allouer les champs de rayons neuronaux entre plusieurs unités de traitement graphique (GPU) (NeRF)
    IA 968 2024-04-30 16:50:14
  • WizardLM-2, qui est « très proche de GPT-4 », a été retiré en urgence par Microsoft. Quelle est l'histoire intérieure ?
    WizardLM-2, qui est « très proche de GPT-4 », a été retiré en urgence par Microsoft. Quelle est l'histoire intérieure ?
    Il y a quelque temps, Microsoft a commis une erreur : il a largement ouvert WizardLM-2, puis l'a retiré proprement peu de temps après. Informations de version actuellement interrogeables pour WizardLM-2, un grand modèle open source "vraiment comparable à GPT-4" avec des performances améliorées en matière de chat complexe, multilingue, d'inférence et d'agence. La série comprend trois modèles : WizardLM-28x22B, WizardLM-270B et WizardLM-27B. Parmi eux : WizardLM-28x22B est le modèle le plus avancé et le meilleur LLM open source après évaluation interne pour des tâches très complexes. WizardLM-270B possède des capacités de raisonnement de haut niveau et constitue le premier choix de la même échelle ;
    IA 540 2024-04-30 16:40:12
  • L'équipe Python n'a pas encore été dissoute et Google prend à nouveau des mesures contre Flutter et Dart
    L'équipe Python n'a pas encore été dissoute et Google prend à nouveau des mesures contre Flutter et Dart
    La semaine dernière, la nouvelle selon laquelle « Google a licencié son équipe de fondation Python » a suscité de vives discussions. « Une mise à jour de Thomas Wouters, membre du comité directeur Python de Google, a surpris tout le monde : « Lorsque tous ceux avec qui vous travaillez directement, y compris votre superviseur, sont licenciés – oh, les postes sont supprimés et on vous demande de planifier leurs remplacements. ont été recrutés et on a demandé à ces personnes d'occuper les mêmes postes dans différents pays, mais cela ne les a pas plu. "Juste au moment où les gens discutaient des raisons pour lesquelles Google licenciait l'équipe Python, Google a de nouveau diffusé la nouvelle du "licenciement d'employés dans des équipes clés telles que Flutter, Dart, Python, etc." Selon le média étranger TechCrunch, Google a confirmé
    IA 1256 2024-04-30 16:01:28
  • L'importance de l'IA Open Source en 2024
    L'importance de l'IA Open Source en 2024
    La demande d’IA open source continuera de croître jusqu’en 2024. L’IA open source permet aux développeurs d’accéder aux travaux de chacun et de s’enrichir mutuellement, permettant ainsi la collaboration, la transparence et l’innovation dans le domaine. Cela accélère le développement de la technologie de l’IA, augmente l’accessibilité et démocratise les capacités de l’IA. Discutons brièvement de l’importance de l’IA open source. Voici quelques points clés sur l’importance de l’IA open source en 2024 : Collaboration : L’IA open source favorise la collaboration entre les développeurs, les chercheurs et les organisations pour partager des connaissances et des ressources, accélérant ainsi les progrès dans le domaine. En partageant ouvertement des algorithmes, des modèles et des outils, le rythme de l’innovation s’accélérera à mesure que se maintiendra un esprit collectif mondial qui aidera à affiner et à faire progresser les capacités de l’IA. Transparence : activée
    IA 900 2024-04-30 09:07:22
  • Le modèle multimodal de l'Assemblée populaire nationale évolue vers l'AGI : il réalise pour la première fois des mises à jour indépendantes et la génération de photos et de vidéos dépasse Sora
    Le modèle multimodal de l'Assemblée populaire nationale évolue vers l'AGI : il réalise pour la première fois des mises à jour indépendantes et la génération de photos et de vidéos dépasse Sora
    Lors du Forum parallèle général sur l'intelligence artificielle du Forum Zhongguancun qui s'est tenu le 27 avril, Sophon Engine, une startup affiliée à l'Université Renmin de Chine, a lancé en grande pompe un nouveau grand modèle multimodal Awaker 1.0, franchissant une étape cruciale vers l'AGI. Par rapport au modèle de séquence ChatImg de génération précédente du moteur Sophon, Awaker 1.0 adopte une nouvelle architecture MOE et a la capacité de se mettre à jour indépendamment. Il s'agit du premier grand modèle multimodal de l'industrie à réaliser une « véritable » mise à jour indépendante. En termes de génération visuelle, Awaker 1.0 utilise une base de génération vidéo VDT entièrement développée par lui-même, qui obtient de meilleurs résultats que Sora dans la génération photo-vidéo, brisant ainsi la difficulté du « dernier kilomètre » de l'atterrissage de grands modèles. Awaker1.0 est
    IA 1121 2024-04-30 08:13:07
  • Un mois après la conférence GTC, l'API Omniverse Cloud de Nvidia est rapidement mise en œuvre
    Un mois après la conférence GTC, l'API Omniverse Cloud de Nvidia est rapidement mise en œuvre
    Lors de la conférence GTC de cette année, Nvidia a annoncé avoir utilisé des technologies telles que l'IA fonctionnelle générative pour créer un métaverse de pointe, un jumeau numérique industriel et un système logiciel de formation de robots. Basé sur la plateforme de simulation et de collaboration en temps réel Omniverse de NVIDIA. Avec le lancement de l'API OmniverseCloud, les outils permettant de simuler des environnements réels ont étendu leur couverture et sont désormais utilisés par de nombreuses entreprises pour créer des applications et des flux de travail de jumeaux numériques industriels. En mars, un total de cinq nouvelles interfaces de programmation d'applications OmniverseCloud ont été introduites, permettant aux développeurs d'intégrer facilement la technologie de base d'Omniverse directement dans les applications logicielles de conception et d'automatisation existantes pour les jumeaux numériques, ou pour tester et valider des robots ou à partir de
    IA 571 2024-04-30 08:10:22
  • De la conception et de la synthèse des matériaux à l'innovation des catalyseurs et à la neutralité carbone, l'équipe de Tsinghua Wang Xiaonan explore la frontière et la mise en œuvre des « matériaux IA+ ».
    De la conception et de la synthèse des matériaux à l'innovation des catalyseurs et à la neutralité carbone, l'équipe de Tsinghua Wang Xiaonan explore la frontière et la mise en œuvre des « matériaux IA+ ».
    Auteur | Rédacteur Wang Xiaonan de l'Université Tsinghua | Kaixia Dans l'ère actuelle de développement technologique rapide, la recherche et le développement de nouveaux matériaux sont devenus une force clé dans la promotion du progrès scientifique et de la révolution industrielle. Du stockage de l'énergie aux technologies de l'information en passant par la biomédecine, la conception, la synthèse et la caractérisation fonctionnelle de matériaux innovants sont les pierres angulaires des avancées dans ces domaines. La recherche et le développement de nouveaux matériaux ont montré une tendance à des percées dans de nombreux domaines. En termes de stockage d’énergie, les chercheurs travaillent au développement de matériaux de batteries plus efficaces et plus sûrs pour répondre aux besoins de stockage des énergies renouvelables. Dans le même temps, les progrès des technologies de l’information ont également incité les scientifiques des matériaux à suivre les progrès continus de la technologie de l’intelligence artificielle (IA). Son application dans la recherche sur les nouveaux matériaux a ouvert un nouveau paradigme de recherche et est devenue une nouvelle force productive qui dépasse la technologie traditionnelle. Modèle de R&D. spécial
    IA 1484 2024-04-29 21:19:01
  • Le Huawei Software Elite Challenge a été organisé avec succès dix fois et plus de 2 000 élites du logiciel ont rejoint Huawei.
    Le Huawei Software Elite Challenge a été organisé avec succès dix fois et plus de 2 000 élites du logiciel ont rejoint Huawei.
    Le 28 avril 2024, la 10e finale mondiale et cérémonie de remise des prix du Huawei Software Elite Challenge 2024 - « Projet Planck » s'est terminée avec succès. Pendant deux mois, près de 30 000 joueurs et plus de 5 700 équipes provenant de plus de 800 universités du monde entier se sont affrontés avec acharnement lors des préliminaires régionaux, des demi-finales régionales et des finales mondiales des huit principales zones de compétition. La division Nord-Est venait de l'Institut de technologie de Harbin. L'équipe « Yuanmeng Star » a remporté le championnat mondial d'un seul coup et a remporté un prix de 200 000 yuans. Une photo de groupe des finalistes du Huawei Software Elite Challenge 2023. Le champion mondial du Huawei Software Elite Challenge 2024 est un concours de programmation logicielle à grande échelle organisé par Huawei pour les étudiants du monde entier. thème du « Plan Planck », il vise à
    IA 501 2024-04-29 19:22:29

Recommandations d'outils

Code de contact du formulaire de message d'entreprise jQuery

Le code de contact du formulaire de message d'entreprise jQuery est un formulaire de message d'entreprise simple et pratique et le code de la page d'introduction contactez-nous.

Effets de lecture de boîte à musique HTML5 MP3

L'effet spécial de lecture de boîte à musique HTML5 MP3 est un lecteur de musique MP3 basé sur HTML5 + CSS3 pour créer de jolies émoticônes de boîte à musique et cliquer sur le bouton de commutation.

Effets spéciaux du menu de navigation d'animation de particules cool HTML5

L'effet de menu de navigation d'animation de particules cool HTML5 est un effet spécial qui change de couleur lorsque le menu de navigation est survolé par la souris.

Code d'édition par glisser-déposer du formulaire visuel jQuery

Le code d'édition par glisser-déposer du formulaire visuel jQuery est un formulaire visuel basé sur jQuery et le framework bootstrap.

Modèle Web de fournisseur de fruits et légumes biologiques Bootstrap5

Un modèle Web de fournisseur de fruits et légumes biologiques-Bootstrap5
Modèle d'amorçage
2023-02-03

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus

Modèle de page Web réactive de gestion d'arrière-plan d'informations de données multifonctionnelles Bootstrap3-Novus
modèle de back-end
2023-02-02

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5

Modèle de page Web de plate-forme de services de ressources immobilières Bootstrap5
Modèle d'amorçage
2023-02-02

Modèle Web d'informations de CV simples Bootstrap4

Modèle Web d'informations de CV simples Bootstrap4
Modèle d'amorçage
2023-02-02

Matériau vectoriel d'éléments d'été mignons (EPS+PNG)

Il s'agit d'un joli matériau vectoriel d'éléments d'été, comprenant le soleil, un chapeau de soleil, un cocotier, un bikini, un avion, une pastèque, une crème glacée, une boisson fraîche, une bouée, des tongs, un ananas, une conque, une coquille, une étoile de mer, un crabe. , Citrons, crème solaire, lunettes de soleil, etc., le matériel est fourni aux formats EPS et PNG, y compris des aperçus JPG.
Matériau PNG
2024-05-09

Matériel vectoriel de quatre badges de graduation rouges 2023 (AI+EPS+PNG)

Il s'agit d'un matériau vectoriel de badge de remise des diplômes rouge 2023, quatre au total, disponible aux formats AI, EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-29

Oiseau chantant et chariot rempli de fleurs design matériel vectoriel de bannière de printemps (AI + EPS)

Il s'agit d'un matériau vectoriel de bannière printanière conçu avec des oiseaux chanteurs et un chariot rempli de fleurs. Il est disponible aux formats AI et EPS, y compris l'aperçu JPG.
image de bannière
2024-02-29

Matériau vectoriel de chapeau de graduation doré (EPS+PNG)

Il s'agit d'un matériau vectoriel de casquette de graduation dorée, disponible aux formats EPS et PNG, y compris l'aperçu JPG.
Matériau PNG
2024-02-27

Modèle de site Web d'entreprise de services de nettoyage et de réparation de décoration intérieure

Le modèle de site Web d'entreprise de services de nettoyage et d'entretien de décoration d'intérieur est un modèle de site Web à télécharger adapté aux sites Web promotionnels qui proposent des services de décoration, de nettoyage, d'entretien et d'autres organisations de services. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-05-09

Modèle de page de guide de CV personnel aux couleurs fraîches

Le modèle de page de guide de CV de candidature personnelle de correspondance de couleurs fraîches est un téléchargement de modèle Web de page de guide d'affichage de travail de CV de recherche d'emploi personnel adapté au style de correspondance de couleurs fraîches. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-29

Modèle Web de CV de travail créatif de concepteur

Le modèle Web de CV de travail créatif de concepteur est un modèle Web téléchargeable pour l'affichage de CV personnels adapté à divers postes de concepteur. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28

Modèle de site Web d'entreprise de construction d'ingénierie moderne

Le modèle de site Web d'entreprise d'ingénierie et de construction moderne est un modèle de site Web téléchargeable adapté à la promotion du secteur des services d'ingénierie et de construction. Astuce : Ce modèle appelle la bibliothèque de polices Google et la page peut s'ouvrir lentement.
Modèle frontal
2024-02-28