Maison Périphériques technologiques IA Utilisez un moteur volcanique et un grand modèle pour « allumer » le volant de données

Utilisez un moteur volcanique et un grand modèle pour « allumer » le volant de données

Sep 20, 2023 pm 09:21 PM
火山引擎 工程

Dans le processus de transformation de milliers d'industries par de grands modèles, Volcano Engine a pris les devants en fournissant une réponse personnalisée à l'industrie des données.

Le 19 septembre, lors du « Data Flywheel V-Tech Data Driven Technology Summit » qui s'est tenu à Shanghai, Volcano Engine a annoncé les capacités de grand modèle de langage (Large Language Models) de la plateforme d'intelligence numérique VeDI.
Utilisez un moteur volcanique et un grand modèle pour « allumer » le volant de données
Après la mise à niveau du produit, il peut utiliser le langage naturel pour « trouver des chiffres », aider au développement de modèles d'entrepôt de données, optimiser le code, mais également compléter la génération de graphiques visuels et mettre en œuvre une analyse d'attribution lors de conversations et d'autres fonctions. Même les opérateurs ordinaires sans compétences en codage peuvent trouver rapidement des chiffres et les analyser. Actuellement, les produits de données liés au VeDI ont été invités à être testés.

Les produits de données mis à niveau ont considérablement abaissé le seuil d'utilisation des données. Dans le passé, si un opérateur ordinaire voulait trouver le numéro, il avait souvent besoin de demander de l'aide au personnel de R&D. Le personnel de R&D écrivait des codes pour aider à récupérer le numéro. L'analyse d'une donnée nécessitait de combiner de nombreuses connaissances professionnelles. Désormais, grâce à des produits de données améliorés, les opérateurs peuvent saisir à tout moment leurs besoins en langage naturel et obtenir les données souhaitées en temps réel.

Cela stimulera davantage la valeur des données. Au sein de l'entreprise, un seuil d'utilisation plus bas permettra à davantage de personnes dans la chaîne de consommation de données de commencer à contacter et à utiliser les données. Les besoins en données qui ont été supprimés par le seuil réel dans le passé seront satisfaits et les informations commerciales basées sur les données seront satisfaites. plus opportun et la prise de décision sera plus opportune. L’imagination commerciale davantage scientifique et basée sur les données sera libérée.

Pour les entreprises en cours de numérisation, la valeur des données sera publiée à une fréquence de circulation plus élevée et le volant d'inertie des données sera encore accéléré.

Les grands modèles sont intégrés dans la liaison de données complète, réduisant encore davantage le seuil de production et d'utilisation des données

Par rapport aux petits modèles, les grands modèles ont de puissantes capacités de raisonnement par généralisation, des capacités de récupération d'outils externes et code Capacité générative. Ces fonctionnalités ont un impact significatif sur les produits de données.

Une capacité de raisonnement généralisé plus forte signifie une intelligence plus élevée, mais en même temps, elle doit également être complétée en combinant de nombreux outils pour ajuster diverses capacités, telles que les mathématiques et les capacités analytiques. Le modèle d'interaction en langage naturel ouvert à l'ère des grands modèles a également apporté un nouvel espace d'imagination à l'utilisation des produits de données.

À partir de mars de cette année, Byte a commencé à combiner de grands modèles avec des produits de données Dans des tests à petite échelle avec itération rapide, l'équipe de Luo Xuan a rapidement découvert que dans les principaux scénarios de produits de données, les grands modèles Les améliorations. et les changements apportés sont évidents. Par la suite, l'équipe a commencé à expérimenter à grande échelle des scénarios de produits de données, en quantifiant constamment les priorités des scénarios et en promouvant la mise en œuvre de grands modèles dans les produits.

Dans le processus de transformation des grands modèles de l'industrie des données, la sélection des scénarios est l'une des étapes les plus critiques Un scénario d'utilisation approprié doit non seulement être établi sur la base de la technologie actuelle ou prévisible, mais également. Il est garanti qu'après l'ajout de grands modèles, les utilisateurs ou les entreprises peuvent avoir une meilleure expérience tout en apportant plus de valeur de consommation de données, ce qui peut stimuler davantage la production de données.

Luo Xuan a partagé que par exemple, si la solution originale ne prend que 1 à 2 secondes dans certains scénarios, après avoir utilisé un grand modèle, en raison du problème de retard du grand modèle, cela peut prendre plus de 5 secondes pour Si vous utilisez un langage naturel, ce scénario ne peut pas répondre aux besoins d’expérience de l’entreprise en matière de rapidité et n’est pas valide.

« Cependant, par exemple, dans le processus de génération de code court, après l'ajout du langage naturel, l'efficacité de la scène est grandement améliorée à l'avenir, à mesure que les performances des grands modèles continuent de s'améliorer, dans tous les aspects. la liaison de données complète, les grands modèles peuvent Les changements intelligents qu'elle apportera vaudront encore plus la peine d'être attendus. La plateforme VeDI annoncée par Volcano Engine comprend principalement deux parties : DataLeap et DataWind. Parmi eux, le « Number Assistant » de DataLeap peut prendre en charge la recherche de nombres sous forme de questions et réponses, et le « Development Assistant » peut prendre en charge la génération et l'optimisation de code SQL en langage naturel ; langage pour compléter la requête et l’analyse de visualisation de données.
Couvre tout le lien entre la recherche, la récupération et l'analyse des chiffres, abaissant ainsi le seuil technique pour l'ensemble du processus de production et de consommation de données.

DataLeap - Number Finding Assistant

« Trouver des numéros » est généralement la première étape de toute la chaîne de consommation de données. Ce n'est qu'en trouvant les actifs de données corrects que la consommation de données peut être réalisée.Cependant, « trouver des chiffres » dans le processus traditionnel n'est pas une tâche simple et nécessite une forte dépendance à l'égard de l'expertise commerciale. Habituellement, les gens ne peuvent confirmer que par des recherches par mots clés, puis par une sélection manuelle ou par la recherche de développeurs de données professionnels. P Utilisez DataLEAP -Trouver l'assistant "trouver le comptage"

Utilisez un moteur volcanique et un grand modèle pour « allumer » le volant de données

La fonction "Trouver l'assistant", qui se combine avec le grand modèle de langage (LLM), réduit considérablement le seuil de "trouver le comptage". Grâce à « l'Assistant de recherche numérique », les personnes sans compétences en codage peuvent également effectuer des requêtes « anthropomorphes » en langage naturel
Par exemple, un opérateur de commerce électronique peut demander directement : « Quelles sont les conditions de fonctionnement de la salle de diffusion en direct de Haowu dans. les sept derniers jours ? DataLeap - L'assistant de recherche de données recommandera des tableaux liés aux conditions commerciales en fonction de la base de connaissances commerciales et expliquera les dimensions de données correspondant à chaque tableau.

Actuellement, le "Number Finder Assistant" peut mettre en œuvre la récupération par questions-réponses de divers types de données et connaissances métier associées, notamment les tables Hive, les ensembles de données, les tableaux de bord, les indicateurs de données, les dimensions, etc., et réaliser des requêtes anthropomorphes. .

De plus, en plus de faciliter la « recherche de nombres », « l'assistant de recherche de nombres » combiné à la capacité des grands modèles peut encore améliorer la précision de la « recherche de nombres ». Dans le passé, avec les solutions techniques traditionnelles, la récupération des actifs de données reposait sur une gestion de données structurées, et les données commerciales non structurées pouvaient avoir des connexions manquantes. Lorsque des mots-clés sont utilisés pour la récupération, un problème de fragmentation des liens peut en résulter, ce qui peut réduire considérablement le nombre de données basées sur. scénarios commerciaux. Trouvez et consommez efficacement. De plus, la recherche fournit un ensemble de réponses candidates basées sur des mots-clés, ce qui nécessite une sélection et une confirmation manuelles. Il ne s'agit pas de réponses directes, ce qui rend difficile pour les utilisateurs d'avoir une bonne expérience.

Maintenant, dans le processus conversationnel avec les utilisateurs, les grands modèles de langage (LLM) peuvent comprendre les intentions réelles des utilisateurs, rendant le processus de recherche plus ciblé, économisant le coût du jugement humain et « trouver des chiffres » lui-même devient plus Dans le même temps, avec l'amélioration progressive des capacités de compréhension et d'analyse sémantique du modèle, la récupération conversationnelle a une efficacité de récupération plus élevée sur l'ensemble du lien que la simple récupération de mots clés.

DataLeap - Assistant de développement

Dans le processus de production et de traitement des données, l'« Assistant de développement » peut prendre en charge l'utilisation du langage naturel et générer automatiquement du code SQL, il peut automatiquement implémenter la réparation et le code des bogues ; optimisation des codes existants, explications et commentaires, etc. De plus, vous pouvez également consulter des questions d'utilisation de SQL telles que la recherche de documents, l'utilisation de fonctions, des exemples de code, etc.代 Développement automatique du code SQL

L'assistant de développement sous la couche inférieure adopte un grand modèle de langage (LLM). Après une formation massive sur le code et le corpus, vous pouvez entrer en fonction des informations de métadonnées de l'utilisateur et générer de haute qualité. code de traitement des données et avoir la capacité de comprendre, de réécrire, de questionner et de répondre au code.

Utilisez un moteur volcanique et un grand modèle pour « allumer » le volant de données

码 Réparation automatique Le code existant 复 L'assistant de développement a brisé la barrière de la langue et réduit considérablement le seuil de développement des données. « À l’origine, pour (traiter) des données, vous aviez peut-être besoin de connaître un langage de programmation, tel que SQL ou Python, ce qui représente une exigence relativement forte. Cependant, vous n’avez désormais plus besoin d’un langage de programmation et pouvez donc utiliser le langage naturel. Cela signifie que les exigences pour les personnes effectuant cela ont été encore réduites. "

Pour les analystes et les opérateurs qui ont des besoins en matière de consommation de données, ils peuvent effectuer des ETL de base même s'ils ne comprennent pas SQL.
Les opérateurs peuvent laisser DataLeap générer automatiquement des codes de demande de données correspondant aux conditions commerciales, telles que les ventes de commandes par ville ou le trafic des salles de diffusion en direct par période horaire, etc. Les opérateurs peuvent également poser des questions sur la signification du code, par exemple « Y a-t-il un plan d'optimisation pendant l'exécution de cette table ? » ou ils peuvent avoir une conversation : « Aidez-moi à vérifier et à corriger cette chaîne de code. » Vous pouvez également analyser le code généré en un seul clic, appeler des outils SQL pour vérifier le tableau et cliquer pour confirmer la réparation automatique de l'IA afin d'optimiser davantage les actifs de données.

Plus important encore, pour les développeurs professionnels, DataLeap - Development Assistant peut les aider à effectuer certains travaux de base et à répondre à certains besoins complexes mais fondamentaux des analystes de données et des opérateurs commerciaux qui s'appuient sur les données, les ingénieurs n'ont qu'à corriger et vérifier les données. précision du code généré à la fin.
En conséquence, le personnel de R&D peut se concentrer sur un travail plus créatif, se concentrer davantage sur les besoins de scénarios complexes, utiliser des assistants de développement pour optimiser le code et améliorer la productivité de la R&D et la qualité du code.

DataWind - Assistant d'analyse

Après avoir réalisé la recherche et la récupération des nombres, nous sommes arrivés au lien d'analyse des données. DataWind - Analysis Assistant, qui combine des capacités de modèles étendus, peut aider les personnes occupant des postes non analytiques à réaliser une série d'explorations commerciales telles que des requêtes et des analyses de visualisation de données via un dialogue en langage naturel, abaissant ainsi le seuil de ce lien.
La première est la création du « dataset ». Avec les actifs de données, les opérateurs utilisent le glisser-déposer DataWind pour créer des ensembles de données, puis utilisent le langage naturel pour définir la logique des différents champs, par exemple en vérifiant directement les données de la « période de diffusion en direct des grandes célébrités ».

Une fois le champ généré 后 Après l'avoir vérifié, l'opérateur peut visualiser l'analyse et l'exploration. Dans le passé, les outils de BI utilisaient généralement des opérations de glisser-déposer. Même si le seuil a été abaissé dans la production de tableaux de bord, dans le domaine de l'analyse et de l'insight, une grande quantité de connaissances professionnelles est encore nécessaire pour mieux comprendre les données. un "seuil".

Utilisez un moteur volcanique et un grand modèle pour « allumer » le volant de données

                                                                                                                                                                    Exploration visuelle

capable de réaliser des hypothèses et des vérifications de base, et de proposer des idées d'analyse.
La fonction d'analyse automatique de l'IA fournie par DataWind peut prendre en charge une exploration plus approfondie des raisons qui la sous-tendent sur la base de graphiques. Par exemple, l'IA peut analyser automatiquement les graphiques visuels générés tels que le « graphique du trafic de la salle de diffusion en direct par période de temps » et la « zone supérieure des ventes de la salle de diffusion en direct ». Il suffit aux opérateurs de procéder à une attribution plus approfondie via un dialogue basé sur les résultats de l'analyse.

Utilisez un moteur volcanique et un grand modèle pour « allumer » le volant de données

Dans le même temps, DataWind se connecte également à des outils de collaboration bureautiques tels que Feishu. Les utilisateurs peuvent effectuer des analyses plus étendues grâce à l'abonnement aux messages de messagerie instantanée et aux conversations naturelles, réalisant une analyse flexible à tout moment et en tout lieu, répondant aux besoins des ensembles de données, visuels. les informations et les abonnements aux messages. L'intelligence en libre-service sur l'ensemble de la liaison et l'intégration du bureau de China Unicom permettent d'intégrer de manière transparente l'analyse des données dans la vie quotidienne.
Messages de messagerie instantanée coordonnés Abonnez-vous pour l'analyse d'extension

L'analyse du seuil pour les assistants d'analyse réduira encore le seuil d'analyse de la lecture des « diagrammes de données » pour comprendre directement les résultats grâce au dialogue en langage naturel, à l'analyse des données et au cycle de réflexion. a été considérablement raccourci pour résoudre l'analyse passée de l'analyse passée. Obtenez un aperçu des problèmes qui nécessitent beaucoup de connaissances professionnelles et raccourcissez le cycle d'analyse des données.

À ce stade, les scénarios d'application de DataWind - Analysis Assistant sont déjà très riches. En plus de permettre l'exploration conversationnelle dans les scénarios d'analyse de base, Analysis Assistant étend également ses capacités à la génération d'expressions et à d'autres tâches qui nécessitaient auparavant davantage. seuils techniques dans la scène.

Le grand modèle accélère le volant d'inertie des données pour aider les entreprises à mieux s'orienter vers les données

ByteDance possède un gène profond axé sur les données. Depuis sa création, presque tous les scénarios de ByteDance ont été soumis à des tests A/B, et des ajustements sont effectués grâce au retour de données pour piloter les stratégies commerciales, par exemple si l'effet d'optimisation de la qualité vidéo de Douyin est bon, si l'optimisation de la stratégie de l'algorithme de recommandation est bonne. précis, et même les noms de Toutiao ont également été testés A/B.

Au sein de Byte, le périmètre de consommation de données est très large. Sur le plan organisationnel, tout le monde, des cadres supérieurs aux cadres intermédiaires, ainsi que les employés de première ligne, peuvent essentiellement voir les données et les utiliser pour évaluer l'état opérationnel, les revenus et les dépenses de l'entreprise, les progrès commerciaux et les stratégies de produits. Dans des scénarios spécifiques, tels que le marketing en temps réel dans le commerce électronique en direct, les opérations conçoivent et mettent en œuvre les stratégies marketing correspondantes basées sur des données en temps réel.

Byte a permis une prise de décision scientifique et une action agile grâce à la consommation de données, ce qui a amélioré la valeur commerciale grâce à une consommation fréquente de données et des avantages commerciaux, il a ciblé la construction d'actifs de données de haute qualité à faible coût pour mieux prendre en charge les applications métiers.

En avril de cette année, sur la base de plus de dix ans d'expérience pratique axée sur les données de ByteDance, Volcano Engine a publié un nouveau paradigme pour la mise à niveau de l'intelligence numérique d'entreprise, le « Data Flywheel », utilisant le « Data Flywheel » pour pleinement résumer le flux de données de l'entreprise Après avoir été intégré aux flux commerciaux, il peut obtenir l'effet volant d'amélioration des actifs de données et des applications métier.

Dans le cadre de la tendance générale à la numérisation, les entreprises de milliers de secteurs se rapprochent de la numérisation et les données deviennent de plus en plus importantes pour les entreprises. En tant que nouveau facteur de production, les données accompagnent la transformation numérique et intelligente des entreprises. Mais objectivement parlant, même si de nombreuses entreprises ont fait beaucoup de construction numérique, elles ne parviennent pas à libérer pleinement la valeur des données.

"Une entreprise peut déployer des produits de données à un prix élevé, mais il se peut que très peu de personnes les utilisent réellement en interne. Si les données sont difficiles à circuler, il sera difficile d'en réaliser la valeur." observé sur le marché des produits de données,
De nombreuses entreprises en pleine construction numérique rencontrent des problèmes tels que des coûts élevés de construction et de gestion des données, des barrières élevées à l'utilisation des produits de données et une faible valeur des actifs de données.

Du point de vue de l'ensemble du processus de numérisation, il est difficile mais correct d'être "data-driven". Prenant Byte comme exemple, Luo Xuan a révélé qu'actuellement, 80 % des employés de ByteDance peuvent utiliser directement les produits de données et que les actifs de données gérables et opérationnels couvrent 80 % des scénarios d'analyse quotidiens. À en juger par l'expérience de Byte, cela signifie que le taux d'utilisation des produits de données internes au sein de l'entreprise et la couverture des actifs de données gérables et opérationnels dans le scénario doivent être augmentés à un niveau plus élevé afin de former un bon « volant de données » dans le entreprise. .

Dans ce processus, les produits de données soutenus par de grands modèles peuvent être une force motrice importante pour aider les entreprises à atteindre leurs objectifs.
La plateforme d'intelligence numérique VeDI, qui a été mise à niveau avec des capacités de grands modèles, réduit encore l'ensemble du processus de production et de consommation de données, tel que la recherche de nombres, la récupération de nombres et l'analyse des données. Avec le même niveau de demande, grâce au VeDI mis à niveau, le nombre de personnes dans l'entreprise ayant la capacité d'utiliser des produits de données est passé des analystes de données professionnels à toutes les personnes ayant des besoins en données, qui peuvent être des opérations, des patrons, des chefs de produit, etc. La consommation de données devient inclusive.

"Ce n'est qu'en abaissant le seuil et en utilisant les données que nous pourrons savoir quel type de valeur les données généreront dans la circulation." Pour les entreprises qui viennent d'entrer dans le processus de numérisation, la valeur des données est loin d'être la même. les trésors découverts et les produits de données à seuil inférieur peuvent être la clé pour les débloquer.

Avec la bénédiction des grands modèles, le « volant de données » au sein de l'entreprise va accélérer sa rotation.
L'activité de l'entreprise dispose d'un moteur plus puissant et le personnel de l'entreprise peut obtenir rapidement des retours de données à partir de « données sortantes en quelques secondes », optimisant ainsi l'entreprise plus rapidement. Dans le processus d'accélération du flux de données, davantage d'actifs de données de haute qualité continuent de s'accumuler. Donnez à l'entreprise plus d'informations et, en fin de compte, rendez les décisions commerciales plus scientifiques et plus agiles.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

L'auteur de ControlNet a encore un succès ! L'ensemble du processus de génération d'une peinture à partir d'une image, gagnant 1,4k étoiles en deux jours L'auteur de ControlNet a encore un succès ! L'ensemble du processus de génération d'une peinture à partir d'une image, gagnant 1,4k étoiles en deux jours Jul 17, 2024 am 01:56 AM

Il s'agit également d'une vidéo Tusheng, mais PaintsUndo a emprunté une voie différente. L'auteur de ControlNet, LvminZhang, a recommencé à vivre ! Cette fois, je vise le domaine de la peinture. Le nouveau projet PaintsUndo a reçu 1,4kstar (toujours en hausse folle) peu de temps après son lancement. Adresse du projet : https://github.com/lllyasviel/Paints-UNDO Grâce à ce projet, l'utilisateur saisit une image statique et PaintsUndo peut automatiquement vous aider à générer une vidéo de l'ensemble du processus de peinture, du brouillon de ligne au suivi du produit fini. . Pendant le processus de dessin, les changements de lignes sont étonnants. Le résultat vidéo final est très similaire à l’image originale : jetons un coup d’œil à un dessin complet.

En tête de liste des ingénieurs logiciels d'IA open source, la solution sans agent de l'UIUC résout facilement les problèmes de programmation réels du banc SWE. En tête de liste des ingénieurs logiciels d'IA open source, la solution sans agent de l'UIUC résout facilement les problèmes de programmation réels du banc SWE. Jul 17, 2024 pm 10:02 PM

La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Les auteurs de cet article font tous partie de l'équipe de l'enseignant Zhang Lingming de l'Université de l'Illinois à Urbana-Champaign (UIUC), notamment : Steven Code repair ; doctorant en quatrième année, chercheur

Travail posthume de l'équipe OpenAI Super Alignment : deux grands modèles jouent à un jeu et le résultat devient plus compréhensible Travail posthume de l'équipe OpenAI Super Alignment : deux grands modèles jouent à un jeu et le résultat devient plus compréhensible Jul 19, 2024 am 01:29 AM

Si la réponse donnée par le modèle d’IA est incompréhensible du tout, oseriez-vous l’utiliser ? À mesure que les systèmes d’apprentissage automatique sont utilisés dans des domaines de plus en plus importants, il devient de plus en plus important de démontrer pourquoi nous pouvons faire confiance à leurs résultats, et quand ne pas leur faire confiance. Une façon possible de gagner confiance dans le résultat d'un système complexe est d'exiger que le système produise une interprétation de son résultat qui soit lisible par un humain ou un autre système de confiance, c'est-à-dire entièrement compréhensible au point que toute erreur possible puisse être trouvé. Par exemple, pour renforcer la confiance dans le système judiciaire, nous exigeons que les tribunaux fournissent des avis écrits clairs et lisibles qui expliquent et soutiennent leurs décisions. Pour les grands modèles de langage, nous pouvons également adopter une approche similaire. Cependant, lorsque vous adoptez cette approche, assurez-vous que le modèle de langage génère

Du RLHF au DPO en passant par TDPO, les algorithmes d'alignement des grands modèles sont déjà « au niveau des jetons » Du RLHF au DPO en passant par TDPO, les algorithmes d'alignement des grands modèles sont déjà « au niveau des jetons » Jun 24, 2024 pm 03:04 PM

La colonne AIxiv est une colonne où ce site publie du contenu académique et technique. Au cours des dernières années, la rubrique AIxiv de ce site a reçu plus de 2 000 rapports, couvrant les meilleurs laboratoires des principales universités et entreprises du monde entier, favorisant efficacement les échanges et la diffusion académiques. Si vous souhaitez partager un excellent travail, n'hésitez pas à contribuer ou à nous contacter pour un rapport. Courriel de soumission : liyazhou@jiqizhixin.com ; zhaoyunfeng@jiqizhixin.com Dans le processus de développement de l'intelligence artificielle, le contrôle et le guidage des grands modèles de langage (LLM) ont toujours été l'un des principaux défis, visant à garantir que ces modèles sont à la fois puissant et sûr au service de la société humaine. Les premiers efforts se sont concentrés sur les méthodes d’apprentissage par renforcement par feedback humain (RL

L'effet marketing a été grandement amélioré, c'est ainsi que la création vidéo AIGC doit être utilisée L'effet marketing a été grandement amélioré, c'est ainsi que la création vidéo AIGC doit être utilisée Jun 25, 2024 am 12:01 AM

Après plus d'un an de développement, AIGC est progressivement passé de la génération de dialogues textuels et d'images à la génération de vidéos. Il y a quatre mois, la naissance de Sora a provoqué un remaniement dans le domaine de la génération vidéo et a vigoureusement promu la portée et la profondeur des applications d'AIGC dans le domaine de la création vidéo. A l’heure où tout le monde parle de grands modèles, d’un côté on est surpris par le choc visuel apporté par la génération vidéo, de l’autre on est confronté à la difficulté de mise en œuvre. Il est vrai que les grands modèles sont encore dans une période de rodage, depuis la recherche et le développement technologique jusqu'à la pratique des applications, et qu'ils doivent encore être ajustés en fonction de scénarios commerciaux réels, mais la distance entre l'idéal et la réalité se réduit progressivement. Le marketing, en tant que scénario de mise en œuvre important de la technologie de l’intelligence artificielle, est devenu une direction dans laquelle de nombreuses entreprises et praticiens souhaitent faire des percées. Une fois que vous maîtriserez les méthodes appropriées, le processus créatif des vidéos marketing sera

Les articles arXiv peuvent être publiés sous forme de 'barrage', la plateforme de discussion alphaXiv de Stanford est en ligne, LeCun l'aime Les articles arXiv peuvent être publiés sous forme de 'barrage', la plateforme de discussion alphaXiv de Stanford est en ligne, LeCun l'aime Aug 01, 2024 pm 05:18 PM

acclamations! Qu’est-ce que ça fait lorsqu’une discussion sur papier se résume à des mots ? Récemment, des étudiants de l'Université de Stanford ont créé alphaXiv, un forum de discussion ouvert pour les articles arXiv qui permet de publier des questions et des commentaires directement sur n'importe quel article arXiv. Lien du site Web : https://alphaxiv.org/ En fait, il n'est pas nécessaire de visiter spécifiquement ce site Web. Il suffit de remplacer arXiv dans n'importe quelle URL par alphaXiv pour ouvrir directement l'article correspondant sur le forum alphaXiv : vous pouvez localiser avec précision les paragraphes dans. l'article, Phrase : dans la zone de discussion sur la droite, les utilisateurs peuvent poser des questions à l'auteur sur les idées et les détails de l'article. Par exemple, ils peuvent également commenter le contenu de l'article, tels que : "Donné à".

Une avancée significative dans l'hypothèse de Riemann ! Tao Zhexuan recommande fortement les nouveaux articles du MIT et d'Oxford, et le lauréat de la médaille Fields, âgé de 37 ans, a participé Une avancée significative dans l'hypothèse de Riemann ! Tao Zhexuan recommande fortement les nouveaux articles du MIT et d'Oxford, et le lauréat de la médaille Fields, âgé de 37 ans, a participé Aug 05, 2024 pm 03:32 PM

Récemment, l’hypothèse de Riemann, connue comme l’un des sept problèmes majeurs du millénaire, a réalisé une nouvelle avancée. L'hypothèse de Riemann est un problème mathématique non résolu très important, lié aux propriétés précises de la distribution des nombres premiers (les nombres premiers sont les nombres qui ne sont divisibles que par 1 et par eux-mêmes, et jouent un rôle fondamental dans la théorie des nombres). Dans la littérature mathématique actuelle, il existe plus d'un millier de propositions mathématiques basées sur l'établissement de l'hypothèse de Riemann (ou sa forme généralisée). En d’autres termes, une fois que l’hypothèse de Riemann et sa forme généralisée seront prouvées, ces plus d’un millier de propositions seront établies sous forme de théorèmes, qui auront un impact profond sur le domaine des mathématiques et si l’hypothèse de Riemann s’avère fausse, alors parmi eux ; ces propositions qui en font partie perdront également de leur efficacité. Une nouvelle percée vient du professeur de mathématiques du MIT, Larry Guth, et de l'Université d'Oxford

La formation Axiom permet au LLM d'apprendre le raisonnement causal : le modèle à 67 millions de paramètres est comparable au niveau de mille milliards de paramètres GPT-4. La formation Axiom permet au LLM d'apprendre le raisonnement causal : le modèle à 67 millions de paramètres est comparable au niveau de mille milliards de paramètres GPT-4. Jul 17, 2024 am 10:14 AM

Montrez la chaîne causale à LLM et il pourra apprendre les axiomes. L'IA aide déjà les mathématiciens et les scientifiques à mener des recherches. Par exemple, le célèbre mathématicien Terence Tao a partagé à plusieurs reprises son expérience de recherche et d'exploration à l'aide d'outils d'IA tels que GPT. Pour que l’IA soit compétitive dans ces domaines, des capacités de raisonnement causal solides et fiables sont essentielles. La recherche présentée dans cet article a révélé qu'un modèle Transformer formé sur la démonstration de l'axiome de transitivité causale sur de petits graphes peut se généraliser à l'axiome de transitivité sur de grands graphes. En d’autres termes, si le Transformateur apprend à effectuer un raisonnement causal simple, il peut être utilisé pour un raisonnement causal plus complexe. Le cadre de formation axiomatique proposé par l'équipe est un nouveau paradigme pour l'apprentissage du raisonnement causal basé sur des données passives, avec uniquement des démonstrations.

See all articles