L'avenir de la visualisation des données IA-Tutoriel Python-php.cn

Maison

développement back-end

Tutoriel Python

L'avenir de la visualisation des données IA

Mary-Kate Olsen

Oct 31, 2024 am 03:09 AM

The future of AI data visualization

Depuis que les LLM sont entrés en scène, l'un des tout premiers cas d'utilisation/démo était l'analyse de données. À ce stade, la plupart d’entre nous ont utilisé ChatGPT, Claude ou une autre IA pour générer un graphique, mais il semble que le jury n’ait pas encore déterminé le rôle que l’IA jouera dans la visualisation des données. Allons-nous continuer à utiliser par défaut les graphiques pointer-cliquer ? L’IA générera-t-elle 100 % des graphiques ? Ou le futur est-il hybride, mélangeant une certaine génération d'IA et du pointer-cliquer ?

En tant que fondateur dans le domaine de l'IA et de la visualisation de données, je trouve ce sujet presque existentiel. Fondés après 2022 (c'est-à-dire après que les LLM soient réellement entrés en scène), nous devons prendre une décision sur la manière dont nous voulons gérer la cartographie. Devons-nous investir des heures et des heures de travail de développement (et des fonds) pour développer des fonctionnalités de cartographie, ou est-ce que cela va disparaître et entraîner un coût irrécupérable pour tous les outils construits avant les LLM ? Ou le futur est-il hybride ? Je suis récemment tombé sur Data Formulator, un projet de recherche qui explore des interactions vraiment intéressantes entre l'IA et la cartographie traditionnelle, ce qui a relancé cette question pour moi.

Dans cet article, je vais jeter un œil à où nous en sommes aujourd'hui en matière de texte vers graphique (ou texte vers visualisation) et vers où nous pourrions nous diriger à l'avenir.

L'état actuel de la synthèse texte-visualisation

Comme tout ce qui concerne l’IA, cet article ne vieillira probablement pas très bien. Une nouvelle information ou un nouveau modèle sortira dans les 6 prochains mois et changera complètement notre façon de penser ce sujet. Néanmoins, jetons un coup d'œil aux différents états de la visualisation des données et de l'IA.

Cartographie pure par pointer-cliquer

Je ne m’attarderai pas trop sur celui-ci puisque la plupart des lecteurs le connaissent bien. Ouvrez Excel, Google Sheets ou tout autre outil de données construit avant 2023 et vous en aurez une forme ou une autre. Parfois, vous cliquez pour ajouter des données à un axe, parfois vous faites glisser et déposez un champ, mais le concept est le même : vous structurez les données de manière appropriée, puis vous appuyez sur quelques boutons pour générer un graphique.

Dans ce paradigme, la grande majorité du nettoyage et de la transformation des données a lieu avant la cartographie. Vous pouvez généralement appliquer des métriques d'agrégation telles que la moyenne, la médiane, le nombre, le min, le max, etc. mais toutes les transformations sont assez rudimentaires.

Cartographie générée à 100 % par l'IA

Les graphiques générés par l'IA, ou texte-visualisation, n'existent vraiment que depuis l'avènement des LLM modernes (si nous creusons, des expériences ont eu lieu avant, mais à toutes fins pratiques, nous pouvons nous concentrer sur l'après-2022 LLM).

ChatGPT d'OpenAI peut générer des graphiques non interactifs à l'aide de Python, ou un ensemble limité de graphiques interactifs à l'aide de bibliothèques frontales (voir OpenAI Canvas pour quelques exemples). Comme pour tout ce qui concerne OpenAI, Anthropic a ses propres concepts analogues et possède des artefacts.

Il convient de noter ici que les graphiques générés par l'IA peuvent être subdivisés en deux familles : les graphiques générés purement pythoniques/back-end ou un mélange de back-end et de front-end.

ChatGPT et Claude alternent entre les deux. Former une IA pour générer du code frontal et intégrer ce code frontal pour créer des visualisations peut représenter beaucoup plus de travail que de simplement s'appuyer sur Python, en utilisant une bibliothèque telle que plotly, matplotlib, seaborn. D'un autre côté, les bibliothèques frontales donnent aux fournisseurs et aux utilisateurs plus de contrôle sur l'apparence du graphique et sur l'interactivité. C'est pourquoi les fournisseurs LLM demandent à leur IA de générer des graphiques de base tels que des graphiques à barres, des graphiques linéaires ou des nuages de points, mais tout ce qui est plus sophistiqué comme un diagramme de Sankey ou un graphique en cascade revient à Python.

Une brève barre latérale sur Fabi.ai : étant donné que nous sommes une plateforme d'analyse de données, nous proposons évidemment des graphiques, et malgré certains graphiques pointer-cliquer, la grande majorité des graphiques créés par nos utilisateurs sont générés par l'IA. Jusqu’à présent, nous avons constaté que l’IA est remarquablement efficace pour générer des graphiques, et en tirant parti de Python pur pour la création de graphiques, nous avons pu entraîner l’IA à générer presque tous les graphiques que l’utilisateur peut imaginer. Jusqu'à présent, nous avons choisi cette précision et cette flexibilité plutôt que la fonctionnalité pointer-cliquer et les conceptions d'interface utilisateur personnalisées.
Hybride : génération d'IA dans un paradigme pointer-cliquer
C’est là que les choses commencent à devenir intéressantes dans le débat sur la direction que prend la synthèse texte-visualisation de l’IA. Avance rapide dans 3 ans, lorsque quelqu'un effectuera une analyse, s'il utilise l'IA, laissera-t-il l'IA prendre le contrôle à 100 %, ou l'IA sera-t-elle utilisée dans un environnement mixte où elle ne pourra éditer les graphiques que dans les limites de certaines fonctionnalités pointer-cliquer.

Pour rendre cette image plus concrète, consultez Data Formulator. Il s'agit d'un projet de recherche récent qui tente d'offrir un véritable environnement mixte dans lequel l'IA peut effectuer certaines modifications, mais l'utilisateur peut prendre le relais et utiliser la fonctionnalité pointer-cliquer selon ses besoins.

Si nous posons la question en utilisant une analogie automobile : croyez-vous qu'à l'avenir les voitures n'auront pas de volant, ou pensez-vous qu'il y aura un conducteur qui devra s'asseoir là et faire attention et de temps en temps prendre est-il similaire au fonctionnement actuel de la fonctionnalité de conduite autonome de Tesla ?

Premiers principes : ce que je crois être vrai

La question de savoir où vont les choses est très importante pour nous chez Fabi.ai, car cela pourrait grandement influencer certaines décisions que nous prenons : investissons-nous dans l'intégration d'une bibliothèque de graphiques dans le front-end ? Devons-nous même nous soucier de la fonctionnalité pointer-cliquer ? En tant qu'entreprise innovante et en pleine croissance, leader dans le domaine de l'analyse des données d'IA, nous devons réfléchir à la direction que prend la rondelle, et non à l'endroit où elle se trouve actuellement.

Donc, pour répondre à cette question, je vais utiliser une réflexion sur les premiers principes.

L'IA ne fait que s'améliorer, être plus rapide et moins chère

Dès la première fois que j’ai utilisé l’IA et que des plaintes ont surgi concernant la vitesse et le coût, j’ai cru que l’IA allait continuer à s’améliorer, plus rapidement et moins cher. En gros, le coût par token a diminué de 87 % par an au cours des dernières années. Non seulement le coût a diminué, mais la précision et la vitesse ont également considérablement augmenté.

Au cours des 10 prochaines années, nous regarderons les LLM de 2024 de la même manière que nous regardons les « superordinateurs » des années 80 et 90, maintenant que nous avons tous des superordinateurs dans nos poches partout où nous allons.

Tout cela pour dire que tout argument pour ou contre l'une des différentes approches graphiques mentionnées ci-dessus ne peut pas être que l'IA est trop lente, coûteuse ou imprécise pour générer des graphiques. En d’autres termes, pour croire que les graphiques pointer-cliquer existeront toujours sous quelque forme que ce soit, vous devez croire qu’il y a quelque chose dans l’expérience utilisateur ou le cas d’utilisation qui mérite cette fonctionnalité.

La partie la plus difficile de la visualisation des données réside dans la gestion et le nettoyage des données.

D'après mon expérience, lors de toute forme d'analyse de données impliquant la visualisation, la partie la plus difficile n'est pas la création de graphiques. Le plus difficile est de nettoyer les données et de les préparer dans le bon format pour le graphique que j'essaie de créer.

Disons quelques données d'événements utilisateur comportant les champs suivants :

ID d'événement
Horodatage de début de l'événement
Horodatage de fin de l'événement

Disons maintenant que je souhaite tracer la durée moyenne de l'événement par heure pour mesurer la latence. Avant de pouvoir créer un quelconque type de graphique dans une feuille de calcul ou un outil de création de graphiques existant, je dois :

Calculez l'heure de fin moins l'heure de début (je dois probablement d'abord faire une sorte de formatage)
Pivotez les données par heure, ce qui est en fait étonnamment difficile à faire

Mais en demandant à l'IA de faire cela, elle s'occupe de tout cela et de la cartographie en seulement une seconde ou deux :

# Calculate the event duration in hours
df['Event duration (hours)'] = (df['Event end datetime'] - df['Event start datetime']).dt.total_seconds() / 3600

# Extract the start hour from the start datetime
df['Start hour'] = df['Event start datetime'].dt.hour

# Group by start hour and calculate the average duration
average_duration_by_hour = df.groupby('Start hour')['Event duration (hours)'].mean().reset_index()

# Plot using Plotly
fig = px.bar(
    average_duration_by_hour, 
    x='Start hour', 
    y='Event duration (hours)',
    title='Average Event Duration by Hour',
    labels={'Event duration (hours)': 'Average Duration (hours)', 'Start hour': 'Hour of Day'},
    text='Event duration (hours)'
)

# Show the figure
fig.show()

Copier après la connexion

Et c’était l’un des exemples les plus simples possibles. La plupart du temps, les données du monde réel sont beaucoup plus compliquées.

L'avenir de la visualisation texte-IA : du pointer-cliquer avec une génération 100 % d'IA

À ce stade, vous avez probablement une idée de ma position. Tant que vous pouvez obtenir un ensemble de données à peu près correct avec toutes les données nécessaires à une analyse, l'IA fait déjà un travail remarquablement bon pour le manipuler et le tracer en un clin d'œil. Dans un, deux ou trois ans, il est difficile d’imaginer que ce ne sera pas la norme.

Cela dit, il existe des approches hybrides intéressantes qui apparaissent comme Data Formulator. L’argument en faveur de ce type d’approche est que nos mains et notre cerveau sont peut-être capables d’agir plus rapidement pour effectuer des ajustements qu’il ne nous faut pour réfléchir à ce que nous voulons et l’expliquer suffisamment clairement pour que l’IA fasse son travail. Si je demande « Montrez-moi les ventes totales par mois au cours des 12 derniers mois » en supposant qu'il s'agit d'un graphique à barres empilées réparti par région, il est possible que nous trouvions plus facile de simplement déplacer notre souris. Si tel est le cas, l’approche hybride est peut-être la plus intéressante : demandez à l’IA de faire un premier essai, puis quelques clics et vous avez ce que vous voulez.

La clé du succès, qu'il s'agisse d'une approche complète d'IA ou d'une approche hybride, résidera dans l'expérience utilisateur. Surtout pour l'approche hybride, l'IA et les interactions humaines doivent fonctionner parfaitement de pair et être incroyablement intuitives pour l'utilisateur.

Je suis ravi de voir l'espace se développer et de voir où nous nous dirigeons avec la synthèse texte-visualisation au cours des 12 prochains mois.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment réparer KB5055612 ne parvient pas à s'installer dans Windows 10?

4 Il y a quelques semaines By DDD

<🎜>: Grow A Garden - Guide de mutation complet

3 Il y a quelques semaines By DDD

<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Nordhold: Système de fusion, expliqué

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Comment déverrouiller le grappin

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel Java

1670

Tutoriel CakePHP

1428

Tutoriel Laravel

1329

Tutoriel PHP

1274

Tutoriel C#

1256

Afficher plus

Related knowledge

Python vs C: courbes d'apprentissage et facilité d'utilisation Apr 19, 2025 am 12:20 AM

Python est plus facile à apprendre et à utiliser, tandis que C est plus puissant mais complexe. 1. La syntaxe Python est concise et adaptée aux débutants. Le typage dynamique et la gestion automatique de la mémoire le rendent facile à utiliser, mais peuvent entraîner des erreurs d'exécution. 2.C fournit des fonctionnalités de contrôle de bas niveau et avancées, adaptées aux applications haute performance, mais a un seuil d'apprentissage élevé et nécessite une gestion manuelle de la mémoire et de la sécurité.

Python et temps: tirer le meilleur parti de votre temps d'étude Apr 14, 2025 am 12:02 AM

Pour maximiser l'efficacité de l'apprentissage de Python dans un temps limité, vous pouvez utiliser les modules DateTime, Time et Schedule de Python. 1. Le module DateTime est utilisé pour enregistrer et planifier le temps d'apprentissage. 2. Le module de temps aide à définir l'étude et le temps de repos. 3. Le module de planification organise automatiquement des tâches d'apprentissage hebdomadaires.

Python vs. C: Explorer les performances et l'efficacité Apr 18, 2025 am 12:20 AM

Python est meilleur que C dans l'efficacité du développement, mais C est plus élevé dans les performances d'exécution. 1. La syntaxe concise de Python et les bibliothèques riches améliorent l'efficacité du développement. Les caractéristiques de type compilation et le contrôle du matériel de CC améliorent les performances d'exécution. Lorsque vous faites un choix, vous devez peser la vitesse de développement et l'efficacité de l'exécution en fonction des besoins du projet.

Apprendre Python: 2 heures d'étude quotidienne est-elle suffisante? Apr 18, 2025 am 12:22 AM

Est-ce suffisant pour apprendre Python pendant deux heures par jour? Cela dépend de vos objectifs et de vos méthodes d'apprentissage. 1) Élaborer un plan d'apprentissage clair, 2) Sélectionnez les ressources et méthodes d'apprentissage appropriées, 3) la pratique et l'examen et la consolidation de la pratique pratique et de l'examen et de la consolidation, et vous pouvez progressivement maîtriser les connaissances de base et les fonctions avancées de Python au cours de cette période.

Python vs C: Comprendre les principales différences Apr 21, 2025 am 12:18 AM

Python et C ont chacun leurs propres avantages, et le choix doit être basé sur les exigences du projet. 1) Python convient au développement rapide et au traitement des données en raison de sa syntaxe concise et de son typage dynamique. 2) C convient à des performances élevées et à une programmation système en raison de son typage statique et de sa gestion de la mémoire manuelle.

Quelle partie fait partie de la bibliothèque standard Python: listes ou tableaux? Apr 27, 2025 am 12:03 AM

PythonlistSaReparmentofthestandardLibrary, tandis que les coloccules de colocède, tandis que les colocculations pour la base de la Parlementaire, des coloments de forage polyvalent, tandis que la fonctionnalité de la fonctionnalité nettement adressée.

Python: automatisation, script et gestion des tâches Apr 16, 2025 am 12:14 AM

Python excelle dans l'automatisation, les scripts et la gestion des tâches. 1) Automatisation: La sauvegarde du fichier est réalisée via des bibliothèques standard telles que le système d'exploitation et la fermeture. 2) Écriture de script: utilisez la bibliothèque PSUTIL pour surveiller les ressources système. 3) Gestion des tâches: utilisez la bibliothèque de planification pour planifier les tâches. La facilité d'utilisation de Python et la prise en charge de la bibliothèque riche en font l'outil préféré dans ces domaines.

Python pour le développement Web: applications clés Apr 18, 2025 am 12:20 AM

Les applications clés de Python dans le développement Web incluent l'utilisation des cadres Django et Flask, le développement de l'API, l'analyse et la visualisation des données, l'apprentissage automatique et l'IA et l'optimisation des performances. 1. Framework Django et Flask: Django convient au développement rapide d'applications complexes, et Flask convient aux projets petits ou hautement personnalisés. 2. Développement de l'API: Utilisez Flask ou DjangorestFramework pour construire RestulAPI. 3. Analyse et visualisation des données: utilisez Python pour traiter les données et les afficher via l'interface Web. 4. Apprentissage automatique et AI: Python est utilisé pour créer des applications Web intelligentes. 5. Optimisation des performances: optimisée par la programmation, la mise en cache et le code asynchrones

See all articles