5 juillet 2024, Shanghai - SenseTime, partenaire stratégique de la Conférence mondiale sur l'intelligence artificielle 2024 et de la Conférence de haut niveau sur la gouvernance mondiale de l'intelligence artificielle (WAIC 2024), a organisé le forum sur l'intelligence artificielle « L'amour sans frontières·Xiang Xinli » et a publié le premier modèle domestique A WYSIWYG est « nouveau chaque jour 5o », et l'expérience interactive est comparée à GPT-4o, réalisant un nouveau modèle d'interaction d'IA. En intégrant des informations multimodales, basées sur diverses formes telles que le son, le texte, l'image et la vidéo, le premier modèle WYSIWYG du pays « Ririxin 5o » apporte un nouveau modèle d'interaction IA, c'est-à-dire une interaction multimodale en streaming en temps réel. Ce modèle d'interaction innovant a également été présenté à tout le monde sur les lieux : le personnel a d'abord dit bonjour à "RiRiXin5o", et il a automatiquement reconnu les mots sur la sangle du badge porté par le personnel et a jugé que la scène était le lieu du monde. Conférence sur l'intelligence artificielle, et a déclaré qu'on peut « bien étudier » dans cet endroit.
Ensuite, le personnel a apporté une jolie poupée chiot, "RiRiXin5o" qui a décrit avec précision l'apparence, l'expression et les vêtements importants du chiot - l'un portant un chapeau blanc avec le logo SenseTime imprimé dessus, très mignon. La foule locale s'est alignée. Plus difficile, il suffit d'ouvrir n'importe quelle page d'un livre, "RiRiXin5o" peut l'introduire automatiquement. Il ne s'agit pas d'une simple reconnaissance OCR de texte, mais d'une reconnaissance d'images et de textes pour donner un résumé facile à comprendre. peut être complété en un instant, permettant ainsi une véritable interaction en temps réel. Le personnel a également montré ses "compétences en dessin" sur place et a dessiné un simple petit lapin. "RiRiXin5o" a dit qu'il était mignon, puis le personnel a dessiné une expression souriante. Le sourire s'est capturé. expression, et le personnel a fait un autre changement pour agrandir la bouche et ajouter une langue. Après l'avoir vu, "RiRiXin5o" a immédiatement dit que cette expression était beaucoup plus heureuse.Vous pouvez écouter, lire et rechercher des sujets, tout comme une vraie personne discutant. Ce mode d'interaction est particulièrement adapté aux applications telles que le dialogue en temps réel et la reconnaissance vocale. Il a une forte adaptabilité multitâche et peut naturellement gérer plusieurs tâches. le même modèle de tâches et ajuste de manière adaptative le comportement et la sortie en fonction de différents contextes. La capacité d'obtenir une expérience interactive comparable à GPT-4o est due à l'amélioration complète des capacités du modèle de base « RiRiXin 5.5 ».
Le « RiRiXin 5.0 » sorti en avril de cette année est le premier modèle national à grande échelle à comparer le GPT-4 Turbo. En un peu plus de deux mois, le nouveau système « RiRiXin 5.5 » a reçu de nombreuses mises à niveau. de 30 % en moyenne par rapport à « Ririxin 5.0 », et le raisonnement mathématique, la capacité en anglais et les capacités de suivi des commandes sont considérablement améliorés. L'effet interactif et les multiples indicateurs de base ont atteint la référence GPT-4o.
« Ririxin 5.5 » adopte une architecture experte de collaboration hybride appareil-cloud pour maximiser la collaboration entre les appareils cloud et réduire les coûts de raisonnement. La formation du modèle est basée sur plus de 10 To de jetons de données de formation de haute qualité, dont une grande quantité. données de chaîne de pensée synthétique, pour améliorer la capacité de réflexion. Afin de permettre à davantage d'utilisateurs d'entreprise d'accéder et d'utiliser les puissantes capacités du système grand modèle « RiRiXin » à un seuil bas, SenseTime a récemment lancé le plan « Grand modèle 0 Yuan Go ».Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!