


IBM publie le modèle Granite AI pour la communauté open source
IBM Research a récemment annoncé l'open source de son modèle de base de codage Granite, dans le but de démocratiser les outils d'IA avancés et de promouvoir des changements complets dans la façon dont le code est écrit, maintenu et développé dans tous les secteurs. Cette décision permettra aux développeurs de créer, d'optimiser et de déployer des modèles d'IA plus efficacement, accélérant ainsi l'application de la technologie de l'intelligence artificielle. Granite est un outil de programmation d'IA avancé développé par IBM Research Institute avec des fonctions puissantes. Il est basé sur des standards ouverts
Quel est le niveau du modèle de codage Granite d'IBM ?
Granite est né de l'ambition d'IBM de simplifier le processus de codage. Après avoir pris conscience de la complexité et des exigences de développement rapide inhérentes au développement de logiciels, IBM a utilisé ses solides capacités de recherche scientifique pour créer un ensemble d'outils basés sur l'IA conçus pour aider les développeurs à naviguer dans l'environnement de codage multi-éléments. Granite est conçu pour simplifier le processus de codage, fournir un flux de travail plus efficace et des fonctionnalités d'assistance intelligentes. Il aide les développeurs à gagner du temps et des efforts grâce à des fonctionnalités telles que les tâches automatisées, les suggestions intelligentes et la génération de code. De plus, Granite dispose également d'un environnement de codage riche. Ceci est important pour aider les développeurs à naviguer dans le cycle de codage multi-éléments.
Le summum de ce travail est le modèle de codage Granite, qui a une taille de paramètre d'environ 3 à 4 milliards et est affiné pour des tâches telles que la génération de code, correction de bogues et interprétation du code, pour augmenter les niveaux de productivité dans les flux de travail de développement logiciel.
Le modèle Granite améliore la productivité en automatisant les tâches de codage quotidiennes complexes. Cela accélère non seulement le processus de développement, mais aide également les développeurs à se concentrer davantage sur les tâches les plus créatives et stratégiques du développement logiciel. Pour les entreprises, les grands modèles Granite contribuent à accélérer le lancement des produits et à améliorer la qualité des logiciels.
De plus, le potentiel d’innovation est illimité. Maintenant que la communauté open source a pu modifier et reconstruire le modèle Granite, de nouvelles applications et outils de support peuvent émerger, redéfinissant ainsi les normes et pratiques actuelles en matière de développement logiciel.
Ces modèles sont formés sur le riche ensemble de données de CodeNet, qui contient 500 millions de lignes de code dans plus de 50 langages de programmation, ainsi que des extraits de code, des questions et des descriptions. Une limite de formation aussi large aide le modèle à comprendre et à générer du code avec plus de précision et d'efficacité. Des limites de formation étendues aident le modèle à comprendre et à générer du code avec plus de précision et d'efficacité.
Analyst View
Le modèle Granite améliore la productivité en automatisant les tâches de codage quotidiennes complexes. Cela accélère non seulement le processus de développement, mais aide également les développeurs à se concentrer davantage sur les tâches les plus créatives et stratégiques du développement logiciel. Pour les entreprises, les grands modèles Granite contribuent à accélérer le lancement des produits et à améliorer la qualité des logiciels.
En proposant ces outils puissants sur des plateformes populaires telles que GitHub, Hugging Face, watsonx.ai et RHEL AI de Red Hat, IBM non seulement étend le modèle de base d'utilisateurs potentiels, mais contribue également à piloter le développement collaboratif et la personnalisation de ces modèles.
De plus, le potentiel d’innovation est illimité. Maintenant que la communauté open source a pu modifier et reconstruire le modèle Granite, de nouvelles applications et outils de support peuvent émerger, redéfinissant ainsi les normes et pratiques actuelles en matière de développement logiciel.
Cette décision aura des conséquences considérables. Premièrement, cela réduit considérablement les barrières à l’entrée pour l’application d’outils d’IA de pointe dans le processus de développement logiciel. Les startups et les développeurs indépendants peuvent désormais accéder aux mêmes ressources puissantes que les géants commerciaux, égalisant ainsi les règles du jeu et cultivant une communauté de développement plus dynamique et innovante.
L'approche d'IBM élargit non seulement l'accessibilité aux outils de codage avancés, mais crée également un environnement plus inclusif pour les développeurs de différents niveaux de compétences et de ressources disponibles.
D'un point de vue concurrentiel, IBM se positionne comme un leader du codage basé sur l'IA, défiant directement d'autres géants de la technologie qui explorent également des domaines similaires, mais ne participent peut-être pas encore au modèle open source. En publiant des modèles Granite sur des plateformes populaires telles que GitHub et Hugging Face, IBM est en mesure d'intégrer ses solutions dans les scénarios quotidiens des développeurs, augmentant ainsi son influence et sa visibilité dans la communauté du développement logiciel.
Le modèle open source Granite d'IBM devrait avoir un impact énorme sur l'efficacité de l'entreprise et la productivité des développeurs, établissant ainsi une nouvelle référence pour l'intégration de l'IA dans les outils de développement logiciel.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

L'annotation de texte est le travail d'étiquettes ou de balises correspondant à un contenu spécifique dans le texte. Son objectif principal est d’apporter des informations complémentaires au texte pour une analyse et un traitement plus approfondis, notamment dans le domaine de l’intelligence artificielle. L'annotation de texte est cruciale pour les tâches d'apprentissage automatique supervisées dans les applications d'intelligence artificielle. Il est utilisé pour entraîner des modèles d'IA afin de mieux comprendre les informations textuelles en langage naturel et d'améliorer les performances de tâches telles que la classification de texte, l'analyse des sentiments et la traduction linguistique. Grâce à l'annotation de texte, nous pouvons apprendre aux modèles d'IA à reconnaître les entités dans le texte, à comprendre le contexte et à faire des prédictions précises lorsque de nouvelles données similaires apparaissent. Cet article recommande principalement de meilleurs outils d'annotation de texte open source. 1.LabelStudiohttps://github.com/Hu

L'annotation d'images est le processus consistant à associer des étiquettes ou des informations descriptives à des images pour donner une signification et une explication plus profondes au contenu de l'image. Ce processus est essentiel à l’apprentissage automatique, qui permet d’entraîner les modèles de vision à identifier plus précisément les éléments individuels des images. En ajoutant des annotations aux images, l'ordinateur peut comprendre la sémantique et le contexte derrière les images, améliorant ainsi la capacité de comprendre et d'analyser le contenu de l'image. L'annotation d'images a un large éventail d'applications, couvrant de nombreux domaines, tels que la vision par ordinateur, le traitement du langage naturel et les modèles de vision graphique. Elle a un large éventail d'applications, telles que l'assistance aux véhicules pour identifier les obstacles sur la route, en aidant à la détection. et le diagnostic des maladies grâce à la reconnaissance d'images médicales. Cet article recommande principalement de meilleurs outils d'annotation d'images open source et gratuits. 1.Makesens

Le public familier avec "Westworld" sait que ce spectacle se déroule dans un immense parc à thème pour adultes de haute technologie dans le monde futur. Les robots ont des capacités comportementales similaires à celles des humains, et peuvent se souvenir de ce qu'ils voient et entendent et répéter le scénario principal. Chaque jour, ces robots seront réinitialisés et ramenés à leur état initial. Après la publication de l'article de Stanford « Generative Agents : Interactive Simulacra of Human Behaviour », ce scénario ne se limite plus aux films et aux séries télévisées. L'IA a réussi à le reproduire. scène dans la « ville virtuelle » de Smallville 》Aperçu de l'adresse du papier cartographique : https://arxiv.org/pdf/2304.03442v1.pdf

La technologie de détection et de reconnaissance des visages est déjà une technologie relativement mature et largement utilisée. Actuellement, le langage d'application Internet le plus utilisé est JS. La mise en œuvre de la détection et de la reconnaissance faciale sur le front-end Web présente des avantages et des inconvénients par rapport à la reconnaissance faciale back-end. Les avantages incluent la réduction de l'interaction réseau et de la reconnaissance en temps réel, ce qui réduit considérablement le temps d'attente des utilisateurs et améliore l'expérience utilisateur. Les inconvénients sont les suivants : il est limité par la taille du modèle et la précision est également limitée ; Comment utiliser js pour implémenter la détection de visage sur le web ? Afin de mettre en œuvre la reconnaissance faciale sur le Web, vous devez être familier avec les langages et technologies de programmation associés, tels que JavaScript, HTML, CSS, WebRTC, etc. Dans le même temps, vous devez également maîtriser les technologies pertinentes de vision par ordinateur et d’intelligence artificielle. Il convient de noter qu'en raison de la conception du côté Web

Nouveau SOTA pour des capacités de compréhension de documents multimodaux ! L'équipe Alibaba mPLUG a publié le dernier travail open source mPLUG-DocOwl1.5, qui propose une série de solutions pour relever les quatre défis majeurs que sont la reconnaissance de texte d'image haute résolution, la compréhension générale de la structure des documents, le suivi des instructions et l'introduction de connaissances externes. Sans plus tarder, examinons d’abord les effets. Reconnaissance et conversion en un clic de graphiques aux structures complexes au format Markdown : Des graphiques de différents styles sont disponibles : Une reconnaissance et un positionnement de texte plus détaillés peuvent également être facilement traités : Des explications détaillées sur la compréhension du document peuvent également être données : Vous savez, « Compréhension du document " est actuellement un scénario important pour la mise en œuvre de grands modèles linguistiques. Il existe de nombreux produits sur le marché pour aider à la lecture de documents. Certains d'entre eux utilisent principalement des systèmes OCR pour la reconnaissance de texte et coopèrent avec LLM pour le traitement de texte.

Permettez-moi de vous présenter le dernier projet open source AIGC-AnimagineXL3.1. Ce projet est la dernière itération du modèle texte-image sur le thème de l'anime, visant à offrir aux utilisateurs une expérience de génération d'images d'anime plus optimisée et plus puissante. Dans AnimagineXL3.1, l'équipe de développement s'est concentrée sur l'optimisation de plusieurs aspects clés pour garantir que le modèle atteigne de nouveaux sommets en termes de performances et de fonctionnalités. Premièrement, ils ont élargi les données d’entraînement pour inclure non seulement les données des personnages du jeu des versions précédentes, mais également les données de nombreuses autres séries animées bien connues dans l’ensemble d’entraînement. Cette décision enrichit la base de connaissances du modèle, lui permettant de mieux comprendre les différents styles et personnages d'anime. AnimagineXL3.1 introduit un nouvel ensemble de balises et d'esthétiques spéciales

Le FP8 et la précision de quantification inférieure en virgule flottante ne sont plus le « brevet » du H100 ! Lao Huang voulait que tout le monde utilise INT8/INT4, et l'équipe Microsoft DeepSpeed a commencé à exécuter FP6 sur A100 sans le soutien officiel de NVIDIA. Les résultats des tests montrent que la quantification FP6 de la nouvelle méthode TC-FPx sur A100 est proche ou parfois plus rapide que celle de INT4, et a une précision supérieure à celle de cette dernière. En plus de cela, il existe également une prise en charge de bout en bout des grands modèles, qui ont été open source et intégrés dans des cadres d'inférence d'apprentissage profond tels que DeepSpeed. Ce résultat a également un effet immédiat sur l'accélération des grands modèles : dans ce cadre, en utilisant une seule carte pour exécuter Llama, le débit est 2,65 fois supérieur à celui des cartes doubles. un

Adresse papier : https://arxiv.org/abs/2307.09283 Adresse code : https://github.com/THU-MIG/RepViTRepViT fonctionne bien dans l'architecture ViT mobile et présente des avantages significatifs. Ensuite, nous explorons les contributions de cette étude. Il est mentionné dans l'article que les ViT légers fonctionnent généralement mieux que les CNN légers sur les tâches visuelles, principalement en raison de leur module d'auto-attention multi-têtes (MSHA) qui permet au modèle d'apprendre des représentations globales. Cependant, les différences architecturales entre les ViT légers et les CNN légers n'ont pas été entièrement étudiées. Dans cette étude, les auteurs ont intégré des ViT légers dans le système efficace.
