localisation actuelle:Maison > Articles techniques > Périphériques technologiques > IA
- Direction:
- tous web3.0 développement back-end interface Web base de données Opération et maintenance outils de développement cadre php programmation quotidienne Applet WeChat Problème commun autre technologie Tutoriel CMS Java Tutoriel système tutoriels informatiques Tutoriel matériel Tutoriel mobile Tutoriel logiciel Tutoriel de jeu mobile
- Classer:
-
- Une nouvelle façon de jouer au crowdsourcing ! Le test de référence est né au LLM Arena pour séparer strictement les mauvais étudiants et les meilleurs étudiants.
- Quelle entreprise est la plus forte dans le classement des grands modèles ? Regardez également LLM Arena ~ À ce jour, un total de 90 LLM ont rejoint la bataille et le nombre total de votes des utilisateurs a dépassé 770 000. Picture Cependant, alors que les internautes se moquent des nouveaux modèles qui se précipitent dans les classements et des anciens modèles qui perdent leur dignité, LMSYS, l'organisation derrière Renjia Arena, a tranquillement achevé la transformation des résultats : le test de référence le plus convaincant né du combat réel—— Arena -Dur. Picture Les quatre avantages démontrés par Arena-Hard sont exactement ce dont le benchmark LLM actuel a le plus besoin : - La séparabilité (87,4 %) est nettement meilleure que celle du banc MT (22,6 %) - Classée meilleure avec ChatbotArena Similar, atteignant 89,1 % - rapide ; vitesse de fonctionnement, prix bas
- IA 371 2024-06-02 13:21:08
-
- 2 500 pages de documents algorithmiques ont été divulguées ! La boîte noire la plus puissante de l'historique de recherche est exposée, Google va-t-il être renversé et mis à niveau à nouveau ?
- Écrit par Noah | 51CTO Technology Stack (ID WeChat : blog51cto) Google traverse une mauvaise année. Au cours des deux derniers jours, le moteur de recherche a fourni des informations sur sa fonctionnalité « Aperçus IA » qui fournit souvent des résultats de recherche extrêmement inexacts, suggérant par exemple de manière absurde aux utilisateurs d'utiliser de la colle pour empêcher le fromage de glisser d'une pizza. À cet égard, le PDG Pichai doit également admettre que cela est dû à l'illusion du grand modèle linguistique et qu'il n'y a actuellement aucune solution. Un document interne du moteur de recherche de Google a récemment été divulgué, montrant peut-être pour la première fois au public comment il fonctionne. Cet article a été publié pour la première fois ici. Google n'a pas encore publié de réponse officielle à la fuite et n'a pas contesté l'authenticité des documents. Pendant longtemps, Google a été le
- IA 785 2024-06-02 12:21:35
-
- Goose Factory a créé une société de traduction IA : spécialisée dans les romans en ligne, adaptant automatiquement les styles de langue, et les personnes réelles et GPT-4 peuvent bien le lire.
- Goose Factory a créé une « société de traduction » avec plus de 150 personnes Du patron aux employés, ce sont tous des agents IA ! L'activité principale est la traduction de romans en ligne. La qualité est extrêmement élevée. Les lecteurs qui ont participé à l'évaluation pensent que la traduction est meilleure que celle de personnes réelles. Et par rapport à l’embauche de vraies personnes, l’utiliser pour traduire des œuvres littéraires réduit le coût de près de 80 fois. ATransAgents, avec 30 employés différents dans chaque poste, peut adapter différents styles de traduction en fonction de la langue, du genre et du public cible. Par rapport à la traduction traditionnelle, la traduction obtenue est plus flexible et diversifiée, plus conforme aux habitudes d'expression de la langue cible et plus littéraire. Par conséquent, bien que TransAgents ait « échoué » dans l’évaluation automatique basée sur la similarité, il a gagné une forte reconnaissance de la part des lecteurs et des professionnels. donc
- IA 403 2024-06-02 12:09:21
-
- Le codage de l'IA, est-ce un réel besoin ou un gadget ?
- Invité | Interview par Xu Xiaoqiang | Écrit par Zhang Xiaonan | Produit par Li Meihan | 51CTO Technology Stack (ID WeChat : blog51cto) Depuis la popularité de l'IA générative, l'IA semble avoir « du mal » avec le rôle des programmeurs. Presque de temps en temps, la question de savoir si les outils de programmation d’IA peuvent remplacer les programmeurs sera à nouveau abordée. Les discussions animées suscitées par la programmation de l’IA sèment la confusion : cela déclenchera-t-il une révolution de la productivité dans le domaine de la programmation ? Ou s’agit-il d’une autre cascade trop médiatisée ? Grâce à la programmation de l'IA, Baidu a obtenu une amélioration de 10 % de l'efficacité humaine, et 27 % du nouveau code soumis aujourd'hui par les ingénieurs a été généré par l'IA. Les pionniers de cette réponse sont les grands fabricants qui explorent cette réponse. Cependant, en tant qu'architecte de Baidu Comate, je suis également le fondateur de ce produit.
- IA 1082 2024-06-02 10:15:47
-
- S'adaptant à de multiples formes et tâches, le système d'apprentissage robot open source le plus puissant 'Octopus' est né
- En matière d’apprentissage robotique, une approche courante consiste à collecter un ensemble de données spécifiques à un robot et à une tâche spécifiques, puis à l’utiliser pour entraîner une politique. Cependant, si cette méthode est utilisée pour apprendre à partir de zéro, suffisamment de données doivent être collectées pour chaque tâche, et la capacité de généralisation de la politique qui en résulte est généralement faible. « En principe, l'expérience acquise auprès d'autres robots et tâches peut fournir des solutions possibles, permettant au modèle de voir une variété de problèmes de contrôle du robot, et ces problèmes peuvent améliorer la capacité de généralisation et les performances du robot sur les tâches en aval. capables de gérer une variété de tâches de langage naturel et de vision par ordinateur ont émergé, la construction d'un « modèle de robot universel » est encore difficile « Il est très difficile de former une stratégie de contrôle unifiée pour les robots, y compris.
- IA 668 2024-06-02 10:04:53
-
- Pourquoi les petits modèles de langage sont-ils la prochaine grande nouveauté dans le monde de l'IA ?
- Traducteur | Bugatti Review | Chonglou Dans le domaine de l'IA, les géants de la technologie se sont affrontés pour créer des modèles de langage de plus en plus grands, et maintenant une nouvelle tendance surprenante a émergé : le petit est grand. Alors que les progrès sur les grands modèles de langage (LLM) montrent des signes de stagnation, les chercheurs et les développeurs se tournent de plus en plus vers les petits modèles de langage (SLM). Ce modèle d’IA compact, efficace et adaptable remet en question l’idée selon laquelle « plus c’est gros, mieux c’est » et promet de changer notre façon d’aborder le développement de l’IA. Le LLM commence-t-il à stagner ? Les résultats de comparaison des performances récemment publiés de Vellum et HuggingFace montrent que l'écart de performances entre les LLM se réduit rapidement. Cette tendance est évidente dans des tâches spécifiques telles que les questions à choix multiples, les questions de raisonnement et de mathématiques.
- IA 1143 2024-06-01 22:35:35
-
- Vaut-il mieux avoir plus de données ou une meilleure qualité ? Cette recherche peut vous aider à faire votre choix
- La mise à l'échelle du modèle de base fait référence à l'utilisation de davantage de données, de calculs et de paramètres pour la pré-formation, ce qui constitue simplement une « expansion d'échelle ». Bien que la mise à l’échelle directe du modèle semble simple et rudimentaire, elle a en effet apporté de nombreux modèles exceptionnels à la communauté de l’apprentissage automatique. De nombreuses études antérieures ont reconnu la pratique consistant à élargir l'échelle des modèles neuroéconomiques. Les changements dits quantitatifs conduisent à des changements qualitatifs. Cette vision est également connue sous le nom de lois d'échelle neuronale. Cependant, à mesure que la taille du modèle augmente, cela entraîne une consommation intensive de ressources informatiques. Cela signifie que les modèles plus grands nécessitent plus de ressources informatiques, notamment de processeurs et de mémoire. Cela n'est pas réalisable pour de nombreuses applications pratiques, en particulier sur les appareils aux ressources limitées. Les chercheurs ont donc commencé
- IA 1146 2024-06-01 22:09:19
-
- KAN, qui remplace MLP, a été étendu à la convolution par des projets open source
- Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a
- IA 960 2024-06-01 22:03:37
-
- Annotation de cadre de délimitation redondant multi-grille pour une détection précise des objets
- 1. Introduction Actuellement, les principaux détecteurs d'objets sont des réseaux à deux étages ou à un étage basés sur le réseau de classificateurs de base réutilisé du Deep CNN. YOLOv3 est l'un de ces détecteurs à un étage de pointe bien connus qui reçoit une image d'entrée et la divise en une matrice de grille de taille égale. Les cellules de grille avec des centres cibles sont chargées de détecter des cibles spécifiques. Ce que je partage aujourd'hui est une nouvelle méthode mathématique qui alloue plusieurs grilles à chaque cible pour obtenir une prédiction précise et précise du cadre de délimitation. Les chercheurs ont également proposé une amélioration efficace des données par copier-coller hors ligne pour la détection des cibles. La méthode nouvellement proposée surpasse considérablement certains détecteurs d’objets de pointe actuels et promet de meilleures performances. 2. Le réseau de détection de cibles en arrière-plan est conçu pour utiliser
- IA 685 2024-06-01 21:46:08
-
- Kimi + Coze (coze) est un super combo, je veux construire un GPT-4o
- Bonjour à tous, je m'appelle Laodu. Parmi les grands modèles nationaux, les performances de Kimi sont très bonnes. Heureusement, la plateforme coze prend en charge le grand modèle Kimi. Button est une plate-forme pour créer l'intelligence des agents. Aujourd'hui, nous allons essayer d'utiliser Kimi+ Button pour créer un agent avec l'effet GPT-4o. Tout d'abord, cliquez sur « Créer un bot » sur la page d'accueil du bouton. Le bot est en fait un agent. Sur la photo ici, le modèle de la série Moonshot sélectionné est le grand modèle Kimi. Le point fort de la photo est le "plug-in". Coze fournit un ensemble très riche de plug-ins, qui peuvent être combinés avec le grand. modèle pour remplir de nombreuses fonctions complexes. Pour donner quelques exemples, par exemple la capacité visuelle. Ajoutez un plug-in pour permettre aux grands modèles de générer des images et de visualiser
- IA 1140 2024-06-01 20:23:12
-
- Aperçu de la planification du chemin : basé sur l'échantillonnage, la recherche et l'optimisation, tout est fait !
- 1 Présentation du contrôle décisionnel et de la planification des mouvements Les méthodes actuelles de contrôle décisionnel peuvent être divisées en trois catégories : la planification séquentielle, la planification sensible au comportement et la planification de bout en bout. Planification séquentielle : la méthode la plus traditionnelle, les trois parties de perception, de prise de décision et de contrôle sont relativement claires ; planification tenant compte du comportement : par rapport à la première méthode, le point culminant est l'introduction de la co-conduite homme-machine, véhicule-route collaboration et estimation des risques du véhicule de l'environnement dynamique externe ; Planification de bout en bout : les technologies DL et DRL utilisent une grande quantité de données d'entraînement pour obtenir des informations sensorielles telles que des images, des angles de volant, etc.
- IA 1147 2024-06-01 20:12:48
-
- L'IA générative mène-t-elle à une renaissance du cloud privé ?
- Compilation丨Produit par Noah | 51CTO Technology Stack (ID WeChat : blog51cto) Alors qu'un autre cycle de révolution technologique approche, de nombreuses entreprises sont confrontées à un choix stratégique : continuer à s'appuyer sur la commodité du cloud public ou revenir au cloud privé. L'étreinte de ? Avec le développement rapide de la technologie de l’IA, cette décision est devenue plus urgente. Selon l'enquête Infrastructure Cloud Survey 2023 de Forrester, environ 79 % des quelque 1 300 décideurs cloud d'entreprise interrogés ont déclaré que leurs organisations mettaient en œuvre des cloud privés. En outre, IDC prévoit que les dépenses mondiales en services de cloud privé dédiés, y compris les cloud privés gérés, atteindront 20,4 milliards de dollars en 2024 et doubleront d'ici au moins 2027. Avant 2024, les données d’IDC montrent que
- IA 864 2024-06-01 20:11:36
-
- Li Feifei interprète la direction entrepreneuriale de « l'intelligence spatiale » pour permettre à l'IA de véritablement comprendre le monde
- Une vidéo d'interprétation TED complète de « l'intelligence spatiale », le choix de Li Feifei pour démarrer une entreprise, a été publiée. Il y a quelque temps, Reuters a rapporté en exclusivité que Li Feifei, la célèbre « marraine de l'IA », était en train de créer une start-up et de finaliser une ronde de financement d'amorçage. Lors de la présentation de la startup, un informateur a cité un discours prononcé par Li Feifei à TED à Vancouver, indiquant qu'il avait introduit le concept d'intelligence spatiale dans ce discours TED. Aujourd'hui encore, Li Feifei a publié la vidéo complète de son discours à TED Vancouver sur X. Elle a présenté sur Insight, la perspicacité se transforme en compréhension,
- IA 1147 2024-06-01 19:56:00
-
- Battant GPT-4o en quelques secondes, battant Llama 3 70B en 22B, Mistral AI ouvre son premier modèle de code
- La licorne française d'IA MistralAI, qui vise OpenAI, a fait un nouveau pas : Codestral, le premier grand modèle de code, est né. En tant que modèle d'IA génératif ouvert conçu spécifiquement pour les tâches de génération de code, Codestral aide les développeurs à écrire et à interagir avec le code en partageant des instructions et des points de terminaison d'API d'achèvement. La maîtrise du codage et de l'anglais de Codestral permet aux développeurs de logiciels de concevoir des applications d'IA avancées. La taille des paramètres de Codestral est de 22B, il est conforme à la nouvelle MistralAINon-ProductionLicense et peut être utilisé à des fins de recherche et de test, mais l'utilisation commerciale est interdite. Actuellement, le modèle est disponible en téléchargement sur HuggingFace. lien de téléchargement
- IA 418 2024-06-01 18:32:04
-
- Combinant des caractéristiques quantiques et 20 000 simulations de dynamique moléculaire, un nouvel ensemble de données ML complexe protéine-ligand a été publié dans la sous-journal Nature
- Les modèles linguistiques à grande échelle ont considérablement amélioré la capacité des scientifiques à comprendre la biologie et la chimie, mais les méthodes fiables pour la découverte de médicaments basés sur la structure, la chimie quantique et la biologie structurale restent rares. Des ensembles de données précis sur l’interaction biomolécule-ligand sont nécessaires de toute urgence pour les grands modèles de langage. Afin de résoudre ce problème, des chercheurs de l'Institut de biologie du Centre de recherche Helmholtz de Munich et de l'Université technique de Munich ont proposé MISATO. Il s'agit d'un ensemble de données qui combine les propriétés de mécanique quantique (QM) de petites molécules avec des simulations de dynamique moléculaire (MD) associées d'environ 20 000 complexes expérimentaux protéine-ligand et une validation approfondie des données expérimentales. Partant de la structure expérimentale existante, les chercheurs ont utilisé la mécanique quantique semi-empirique pour améliorer systématiquement ces
- IA 411 2024-06-01 18:20:09