Ce projet demande à ChatGPT de vous apprendre à générer du code Python pour créer des tracés et des visualisations. Fournissez simplement une brève description du tracé que vous souhaitez créer et ChatGPT générera le code nécessaire à l'aide de la bibliothèque populaire Matplotlib. Cet outil permet même aux utilisateurs sans expérience en programmation de développer des tracés de qualité professionnelle pour leurs données. Que vous soyez chercheur, data scientist ou étudiant, ChatGPT facilite la création de tracés magnifiques et informatifs en Python. (Généré par ChatGPT avec des modifications mineures).
Le projet dans JupyterNotebook est disponible gratuitement en classe cognitive.
Demander : "apprenez-moi à tracer en python"
Le résultat :
Il existe de nombreuses façons de tracer des données en Python. Voici un exemple simple utilisant Matplotlib, une bibliothèque de visualisation de données populaire en Python :
# using the provided by chatGPT to run in the notebook import matplotlib.pyplot as plt # Sample data x = [1, 2, 3, 4] y = [1, 4, 9, 16] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.plot(x, y) # Add a title ax.set_title('My Plot') # Show the plot plt.show()
Cela créera un simple tracé linéaire des données en x et y. Il existe de nombreuses options et options de personnalisation disponibles pour créer des tracés dans Matplotlib. Par exemple, vous pouvez modifier l'apparence des lignes, changer les étiquettes des axes, ajouter une légende, etc.
Voici quelques informations supplémentaires sur Matplotlib et d'autres bibliothèques de traçage en Python :
La documentation Matplotlib : https://matplotlib.org/stable/index.html
Un tutoriel sur Matplotlib : https://matplotlib.org/stable/tutorials/index.html
Seaborn, une bibliothèque de visualisation de données basée sur Matplotlib : https://seaborn.pydata.org/
Plotly, une bibliothèque pour créer des tracés interactifs : https://plotly.com/python/
Comme vous pouvez le constater, ChatGPT fournit un texte d'introduction et des blocs de code (avec une icône de copie pour plus de commodité) et conclut la conversation avec des informations utiles supplémentaires.
En demandant simplement « montre-moi plus d'exemples de tracés en python ». En fait, chatGPT se souvient de vos conversations précédentes.
Le résultat :
Voici quelques exemples supplémentaires de tracés que vous pouvez créer en Python à l'aide de la bibliothèque Matplotlib : Nuage de points
import matplotlib.pyplot as plt # Sample data x = [1, 2, 3, 4] y = [1, 4, 9, 16] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.scatter(x, y) # Add a title ax.set_title('My Scatter Plot') # Show the plot plt.show()
Tracé à barres
import matplotlib.pyplot as plt # Sample data x = [1, 2, 3, 4] y = [1, 4, 9, 16] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.bar(x, y) # Add a title ax.set_title('My Bar Plot') # Show the plot plt.show()
Graphique circulaire
import matplotlib.pyplot as plt # Sample data labels = ['Apples', 'Bananas', 'Oranges'] sizes = [30, 45, 25] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.pie(sizes, labels=labels) # Add a title ax.set_title('My Pie Chart') # Show the plot plt.show()
Gardez à l'esprit que ce ne sont que quelques exemples et qu'il existe de nombreux autres types de tracés que vous pouvez créer en Python à l'aide de Matplotlib. Vous pouvez trouver plus d'informations et d'exemples dans la documentation Matplotlib : https://matplotlib.org/stable/index.html.
Traçons à partir d'un exemple d'ensemble de données
L'étape initiale dont vous avez besoin pour charger les données. Nous pouvons demander à ChatGPT de suggérer quelques exemples d'ensembles de données en demandant « Pourriez-vous me donner un exemple d'ensemble de données pour les débutants en python ? »
Le résultat :
Bien sûr! Voici quelques ensembles de données qui pourraient être utiles aux débutants en Python :Ensemble de données sur l'iris : il s'agit d'un petit ensemble de données qui contient des informations sur différentes espèces de fleurs d'iris, y compris la longueur et la largeur des sépales et des pétales. Il est souvent utilisé comme ensemble de données pour débutants pour apprendre les techniques d’apprentissage automatique et d’analyse de données. Vous pouvez charger l'ensemble de données Iris en Python à l'aide du module sklearn.datasets.
Ensemble de données Boston Housing : cet ensemble de données contient des informations sur les prix des logements dans la région de Boston, y compris la valeur médiane des maisons, le taux de criminalité et d'autres facteurs. Il est souvent utilisé comme ensemble de données pour débutants pour apprendre les techniques de régression. Vous pouvez charger l'ensemble de données Boston Housing en Python à l'aide du module sklearn.datasets.
Ensemble de données MNIST : il s'agit d'un ensemble de données de chiffres manuscrits, avec 60 000 exemples de formation et 10 000 exemples de test. Il est souvent utilisé comme ensemble de données pour débutants pour apprendre les techniques de classification d’images. Vous pouvez charger l'ensemble de données MNIST en Python à l'aide du module keras.datasets.
From these suggested datasets, we select Iris dataset to continue to work with as a sample.
h
We need a proper sample in tabular format, so we asked “load iris data with table looking format”
The result:
To load the Iris dataset in a table-like format in Python, you can use the Pandas library. Here is an example of how you can load the Iris dataset and display it in a table-like format:
import pandas as pd from sklearn import datasets # Load the Iris dataset iris = datasets.load_iris() # Create a DataFrame with the features and target values df = pd.DataFrame(iris.data, columns=iris.feature_names) df['target'] = iris.target # Display the DataFrame print(df) #--> or we can call the dataset to displace it df
_This will create a Pandas DataFrame with the features (sepal length, sepal width, petal length, and petal width) of the Iris dataset as columns, and the target values (the species of iris) as an additional column.
You can then use the usual Pandas functions to manipulate and analyze the data in the DataFrame. For example, you can use the head() function to display the first few rows of the DataFrame, or use the describe() function to get summary statistics for the numerical columns._
Conveniently, we can ask follow-up questions; here we asked “plot it”
The result:
To plot the Iris dataset using Matplotlib, you can use the following code:
# --> Trying of the suggestions from ChatGPT # --> we removed the redundant lines (e.g. loading libraries and importing data) from the suggestion # Create a figure and an axes fig, ax = plt.subplots() # Plot the data, coloring the points by the target values scatter = ax.scatter(df['sepal length (cm)'], df['sepal width (cm)'], c=df['target']) # Add a legend legend = ax.legend(*scatter.legend_elements(), title='Species') # Add a title ax.set_title('Iris dataset') # Show the plot plt.show()
We select and ask to plot a specific column in the dataset. For example, asking “show me the distribution of the column ‘sepal length (cm)”
The result:To show the distribution of a column in a Pandas DataFrame, you can use the hist() function of the DataFrame. For example, to show the distribution of the ‘sepal length (cm)’ column in the Iris dataset, you can use the following code:
# Create a figure and an axes fig, ax = plt.subplots() # Plot the distribution of the 'sepal length (cm)' column df['sepal length (cm)'].hist(ax=ax) # Add a title ax.set_title('Distribution of sepal length') # Show the plot plt.show()
As you may notice, the plot does not have labels. Therefore, we can **ask “redo it with proper axis labels”.
The result:**
# Create a figure and an axes fig, ax = plt.subplots() # Plot the distribution of the 'sepal length (cm)' column df['sepal length (cm)'].hist(ax=ax) # Add axis labels ax.set_xlabel('Sepal length (cm)') ax.set_ylabel('Frequency') # Add a title ax.set_title('Distribution of sepal length') # Show the plot plt.show()
Another useful plot to show the distribution is using boxplot which enables us to visualize standard deviation and identify outliers.
Here we ask for a boxplot of all the columns showing in the single plot by asking “show me boxplot of distributions of all columns in same plot”.
The result:To show the distribution of all columns in a Pandas DataFrame as boxplots on the same plot, you can use the boxplot() function of the DataFrame.
For example, to show the distributions of all columns in the Iris dataset as boxplots, you can use the following code:
import matplotlib.pyplot as plt import pandas as pd from sklearn import datasets # Load the Iris dataset iris = datasets.load_iris() # Create a DataFrame with the features df = pd.DataFrame(iris.data, columns=iris.feature_names) # Add a column with the target values df['target'] = iris.target # Create a figure and an axes fig, ax = plt.subplots() # Plot the boxplots of all columns df.boxplot(ax=ax) # Add a title ax.set_title('Distributions of all columns') # Show the plot plt.show()
ChatGPT is an excellent tool for working on your project. It is important to frame the question in a way that addresses your problem. Keep in mind that dividing your project into smaller blocks and addressing them individually is the key to addressing the project.
To ask a programming question from ChatGPT, you can simply provide a clear and concise description of your problem, along with any relevant code or error messages. You should also specify the programming language and any libraries or frameworks that you are using.
So, let's ask ChatGPT what it thinks.
When formulating a prompt for ChatGPT, it’s important to keep a few things in mind in order to get the most out of the model:
Be specific and clear about what you want the model to do. For example, instead of asking “What do you know about this topic?”, ask “Can you provide a brief overview of the history of the topic?”Provide context if necessary. If you’re asking a question about a specific event or person, give some background information so that the model can understand the context in which you’re asking the question.
Soyez concis. Les invites longues et complexes peuvent être difficiles à comprendre pour le modèle et peuvent entraîner des réponses moins précises ou moins pertinentes.
Évitez d'utiliser un langage ou un jargon trop technique avec lequel le modèle n'est peut-être pas familier.
Évitez de poser plusieurs questions à la fois, il est préférable de poser une question à la fois.
Voici quelques exemples de bonnes invites pour ChatGPT :
« Pouvez-vous expliquer la principale différence entre l'apprentissage supervisé et non supervisé ? »«Quels sont les principaux composants d'un réseau de neurones et comment fonctionnent-ils ?»
« S'il vous plaît, écrivez une courte histoire sur un robot capable de lire dans les pensées »
D'un autre côté, quelques exemples de mauvaises invites seraient :
« tout »
« Que peux-tu me dire ? »
"ce que tu sais"En suivant ces directives, vous pouvez contribuer à garantir que vous obtenez les réponses les plus précises et les plus pertinentes du modèle lorsque vous utilisez ChatGPT.
ChatGPT n'est pas parfait ; l'exemple fourni provient de sklearn. Dans le monde réel, vous devez charger vos propres données à partir de votre ressource, à l'aide de Pandas (l'exemple ci-dessous montre le chargement d'iris à partir du stockage local).
En général, en tant que data scientist en exercice, vous serez fréquemment confronté au processus multiforme de collecte, de préparation, de construction de modèles et d'interprétation de données. Ces étapes ont chacune leurs propres exigences en termes de compétences et de ressources. Par exemple, vous pouvez utiliser des pandas pour charger et manipuler vos ensembles de données. Il est important de garder à l’esprit que les exemples fournis par ChatGPT sont destinés à servir d’aide à l’apprentissage de base et peuvent ne pas convenir à la gestion d’ensembles de données plus complexes ou plus substantiels.
Alors, demandons à ChatGPT ce qu'il en pense.
Il y a plusieurs raisons pour lesquelles ChatGPT et d'autres grands modèles de langage ne remplaceront pas les data scientists :
Les data scientists disposent d'un ensemble de compétences beaucoup plus large : les data scientists sont formés à un large éventail de compétences, notamment l'analyse de données, l'apprentissage automatique, la programmation, les statistiques, etc. ChatGPT et d'autres grands modèles de langage ne sont capables de générer du texte qu'en fonction d'une invite donnée, et ils ne possèdent pas les autres compétences que possèdent les data scientists.
Les data scientists peuvent interpréter et expliquer les résultats de leur travail : les data scientists sont formés pour interpréter et expliquer les résultats de leur travail, ce qui est essentiel pour la prise de décision et la communication avec les parties prenantes. ChatGPT et d'autres grands modèles de langage ne sont pas capables d'interpréter ou d'expliquer les résultats de leur travail.
Les data scientists peuvent travailler avec un large éventail de données : les data scientists sont formés pour travailler avec un large éventail de données, y compris des données structurées et non structurées, et ils peuvent utiliser une variété d'outils et de techniques pour extraire des informations des données. ChatGPT et d'autres grands modèles de langage ne sont capables de générer du texte qu'en fonction d'une invite donnée, et ils ne sont pas capables de fonctionner avec d'autres types de données.
Les data scientists peuvent travailler avec un large éventail de parties prenantes : les data scientists sont formés pour travailler avec un large éventail de parties prenantes, notamment des chefs d'entreprise, des experts en la matière et des experts techniques, et ils peuvent communiquer des concepts complexes de manière claire et compréhensible. chemin. ChatGPT et d'autres grands modèles de langage ne sont pas capables de travailler avec les parties prenantes ou de communiquer des concepts complexes.
Découvrez ce projet guidé adapté aux débutants + d'autres cours gratuits développés par des développeurs et des data scientists IBM sur https://cognitiveclass.ai/
À la prochaine fois !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!