이 프로젝트에서는 ChatGPT에게 플롯과 시각화를 생성하기 위한 Python 코드를 생성하는 방법을 가르쳐달라고 요청합니다. 생성하려는 플롯에 대한 간단한 설명을 제공하기만 하면 ChatGPT가 널리 사용되는 Matplotlib 라이브러리를 사용하여 필요한 코드를 생성합니다. 이 도구를 사용하면 프로그래밍 경험이 없는 사용자도 자신의 데이터에 대한 전문가 수준의 플롯을 개발할 수 있습니다. 연구원, 데이터 과학자, 학생이든 ChatGPT를 사용하면 Python으로 아름답고 유익한 플롯을 쉽게 만들 수 있습니다. (사소한 변경으로 ChatGPT에서 생성됨).
JupyterNotebook의 프로젝트는 인지수업에서 무료 이용 가능합니다.
질문:"파이썬으로 플롯하는 방법을 가르쳐 주세요."
결과:
Python에서 데이터를 그리는 방법에는 여러 가지가 있습니다. 다음은 Python에서 널리 사용되는 데이터 시각화 라이브러리인 Matplotlib를 사용한 간단한 예입니다.
# using the provided by chatGPT to run in the notebook import matplotlib.pyplot as plt # Sample data x = [1, 2, 3, 4] y = [1, 4, 9, 16] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.plot(x, y) # Add a title ax.set_title('My Plot') # Show the plot plt.show()
이렇게 하면 x와 y의 데이터에 대한 간단한 선 그래프가 생성됩니다. Matplotlib에서 플롯을 생성하는 데 사용할 수 있는 다양한 옵션과 사용자 정의 옵션이 있습니다. 예를 들어 선 모양 변경, 축 레이블 변경, 범례 추가 등을 수행할 수 있습니다.
다음은 Python의 Matplotlib 및 기타 플로팅 라이브러리에 대한 추가 정보입니다.
Matplotlib 문서: https://matplotlib.org/stable/index.html
Matplotlib 튜토리얼: https://matplotlib.org/stable/tutorials/index.html
Matplotlib 기반 데이터 시각화 라이브러리 Seaborn: https://seaborn.pydata.org/
Plotly, 대화형 플롯을 생성하기 위한 라이브러리: https://plotly.com/python/
보시다시피 ChatGPT는 소개 텍스트와 코드 블록(편의를 위해 복사 아이콘 포함)을 제공하고 추가적인 유용한 정보로 대화를 마무리합니다.
"파이썬 플롯의 더 많은 예를 보여주세요"라고 요청하면 됩니다. 실제로 chatGPT는 이전 대화를 기억합니다.
결과:
다음은 Matplotlib 라이브러리를 사용하여 Python에서 생성할 수 있는 플롯의 몇 가지 예입니다. 산점도
import matplotlib.pyplot as plt # Sample data x = [1, 2, 3, 4] y = [1, 4, 9, 16] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.scatter(x, y) # Add a title ax.set_title('My Scatter Plot') # Show the plot plt.show()
막대 플롯
import matplotlib.pyplot as plt # Sample data x = [1, 2, 3, 4] y = [1, 4, 9, 16] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.bar(x, y) # Add a title ax.set_title('My Bar Plot') # Show the plot plt.show()
원형 차트
import matplotlib.pyplot as plt # Sample data labels = ['Apples', 'Bananas', 'Oranges'] sizes = [30, 45, 25] # Create a figure and an axes fig, ax = plt.subplots() # Plot the data ax.pie(sizes, labels=labels) # Add a title ax.set_title('My Pie Chart') # Show the plot plt.show()
이것은 단지 몇 가지 예일 뿐이며 Matplotlib를 사용하여 Python에서 만들 수 있는 다른 유형의 플롯도 많이 있다는 점을 명심하세요. Matplotlib 문서(https://matplotlib.org/stable/index.html)에서 자세한 정보와 예제를 확인할 수 있습니다.
샘플 데이터세트를 사용해 플롯해 보겠습니다
데이터를 로드해야 하는 초기 단계입니다. ChatGPT에 “Python 초보자를 위한 샘플 데이터세트를 알려주실 수 있나요?”
라고 질문하여 샘플 데이터세트를 제안해 달라고 요청할 수 있습니다. 결과:
확신하는! 다음은 Python 초보자에게 유용할 수 있는 몇 가지 데이터 세트입니다.붓꽃 데이터세트: 꽃받침, 꽃잎 길이, 너비 등 다양한 붓꽃 종에 대한 정보가 포함된 작은 데이터세트입니다. 머신러닝과 데이터 분석 기법을 학습하기 위한 초보자용 데이터세트로 자주 사용됩니다. sklearn.datasets 모듈을 사용하여 Python에서 Iris 데이터세트를 로드할 수 있습니다.
보스턴 주택 데이터세트: 이 데이터세트에는 주택의 중간 가치, 범죄율 및 기타 요인을 포함하여 보스턴 지역의 주택 가격에 대한 정보가 포함되어 있습니다. 회귀 기술을 학습하기 위한 초보자용 데이터 세트로 자주 사용됩니다. sklearn.datasets 모듈을 사용하여 Python에서 Boston Housing 데이터세트를 로드할 수 있습니다.
MNIST 데이터세트: 이것은 60,000개의 훈련 예시와 10,000개의 테스트 예시가 포함된 손으로 쓴 숫자의 데이터세트입니다. 이미지 분류 기술을 학습하기 위한 초보자용 데이터 세트로 자주 사용됩니다. keras.datasets 모듈을 사용하여 Python에서 MNIST 데이터세트를 로드할 수 있습니다.
From these suggested datasets, we select Iris dataset to continue to work with as a sample.
h
We need a proper sample in tabular format, so we asked “load iris data with table looking format”
The result:
To load the Iris dataset in a table-like format in Python, you can use the Pandas library. Here is an example of how you can load the Iris dataset and display it in a table-like format:
import pandas as pd from sklearn import datasets # Load the Iris dataset iris = datasets.load_iris() # Create a DataFrame with the features and target values df = pd.DataFrame(iris.data, columns=iris.feature_names) df['target'] = iris.target # Display the DataFrame print(df) #--> or we can call the dataset to displace it df
_This will create a Pandas DataFrame with the features (sepal length, sepal width, petal length, and petal width) of the Iris dataset as columns, and the target values (the species of iris) as an additional column.
You can then use the usual Pandas functions to manipulate and analyze the data in the DataFrame. For example, you can use the head() function to display the first few rows of the DataFrame, or use the describe() function to get summary statistics for the numerical columns._
Conveniently, we can ask follow-up questions; here we asked “plot it”
The result:
To plot the Iris dataset using Matplotlib, you can use the following code:
# --> Trying of the suggestions from ChatGPT # --> we removed the redundant lines (e.g. loading libraries and importing data) from the suggestion # Create a figure and an axes fig, ax = plt.subplots() # Plot the data, coloring the points by the target values scatter = ax.scatter(df['sepal length (cm)'], df['sepal width (cm)'], c=df['target']) # Add a legend legend = ax.legend(*scatter.legend_elements(), title='Species') # Add a title ax.set_title('Iris dataset') # Show the plot plt.show()
We select and ask to plot a specific column in the dataset. For example, asking “show me the distribution of the column ‘sepal length (cm)”
The result:To show the distribution of a column in a Pandas DataFrame, you can use the hist() function of the DataFrame. For example, to show the distribution of the ‘sepal length (cm)’ column in the Iris dataset, you can use the following code:
# Create a figure and an axes fig, ax = plt.subplots() # Plot the distribution of the 'sepal length (cm)' column df['sepal length (cm)'].hist(ax=ax) # Add a title ax.set_title('Distribution of sepal length') # Show the plot plt.show()
As you may notice, the plot does not have labels. Therefore, we can **ask “redo it with proper axis labels”.
The result:**
# Create a figure and an axes fig, ax = plt.subplots() # Plot the distribution of the 'sepal length (cm)' column df['sepal length (cm)'].hist(ax=ax) # Add axis labels ax.set_xlabel('Sepal length (cm)') ax.set_ylabel('Frequency') # Add a title ax.set_title('Distribution of sepal length') # Show the plot plt.show()
Another useful plot to show the distribution is using boxplot which enables us to visualize standard deviation and identify outliers.
Here we ask for a boxplot of all the columns showing in the single plot by asking “show me boxplot of distributions of all columns in same plot”.
The result:To show the distribution of all columns in a Pandas DataFrame as boxplots on the same plot, you can use the boxplot() function of the DataFrame.
For example, to show the distributions of all columns in the Iris dataset as boxplots, you can use the following code:
import matplotlib.pyplot as plt import pandas as pd from sklearn import datasets # Load the Iris dataset iris = datasets.load_iris() # Create a DataFrame with the features df = pd.DataFrame(iris.data, columns=iris.feature_names) # Add a column with the target values df['target'] = iris.target # Create a figure and an axes fig, ax = plt.subplots() # Plot the boxplots of all columns df.boxplot(ax=ax) # Add a title ax.set_title('Distributions of all columns') # Show the plot plt.show()
ChatGPT is an excellent tool for working on your project. It is important to frame the question in a way that addresses your problem. Keep in mind that dividing your project into smaller blocks and addressing them individually is the key to addressing the project.
To ask a programming question from ChatGPT, you can simply provide a clear and concise description of your problem, along with any relevant code or error messages. You should also specify the programming language and any libraries or frameworks that you are using.
So, let's ask ChatGPT what it thinks.
When formulating a prompt for ChatGPT, it’s important to keep a few things in mind in order to get the most out of the model:
Be specific and clear about what you want the model to do. For example, instead of asking “What do you know about this topic?”, ask “Can you provide a brief overview of the history of the topic?”Provide context if necessary. If you’re asking a question about a specific event or person, give some background information so that the model can understand the context in which you’re asking the question.
간결하게 작성하세요. 길고 복잡한 프롬프트는 모델이 이해하기 어려울 수 있으며 응답의 정확성이나 관련성이 떨어질 수 있습니다.
모델이 익숙하지 않을 수 있는 지나치게 기술적인 언어나 전문 용어를 사용하지 마세요.
하나의 프롬프트에 여러 질문을 하는 것을 피하고 한 번에 하나씩 질문하는 것이 좋습니다.
다음은 ChatGPT에 대한 좋은 메시지의 몇 가지 예입니다.
“지도 학습과 비지도 학습의 주요 차이점을 설명할 수 있나요?”“신경망의 주요 구성요소는 무엇이며 어떻게 작동하나요?”
“마음을 읽는 로봇에 대한 단편 소설을 써주세요”
반면에 잘못된 메시지의 예는 다음과 같습니다.
“모든 것”
“무슨 말을 해주실 수 있나요?”
“당신이 아는 것”이 지침을 따르면 ChatGPT를 사용할 때 모델로부터 가장 정확하고 관련성이 높은 응답을 얻을 수 있습니다.
ChatGPT는 완벽하지 않습니다. 제공된 예는 sklearn에서 가져온 것입니다. 실제로는 Pandas를 사용하여 리소스에서 자체 데이터를 로드해야 합니다(아래 예에서는 로컬 저장소에서 붓꽃을 로드하는 방법을 보여줍니다).
일반적으로 현직 데이터 과학자로서 데이터 수집, 준비, 모델 구성 및 해석의 다면적인 프로세스를 자주 접하게 됩니다. 각 단계에는 기술과 자원 측면에서 고유한 요구 사항이 있습니다. 예를 들어 팬더를 활용하여 데이터 세트를 로드하고 조작할 수 있습니다. ChatGPT에서 제공하는 예제는 기초적인 학습 보조 자료 역할을 하기 위한 것이며 더 복잡하거나 상당한 데이터세트를 처리하는 데 적합하지 않을 수 있다는 점을 명심하는 것이 중요합니다.
그럼 ChatGPT가 어떻게 생각하는지 물어봅시다.
ChatGPT 및 기타 대규모 언어 모델이 데이터 과학자를 대체하지 못하는 데에는 몇 가지 이유가 있습니다.
데이터 과학자는 훨씬 더 광범위한 기술을 보유하고 있습니다. 데이터 과학자는 데이터 분석, 기계 학습, 프로그래밍, 통계 등을 포함한 광범위한 기술에 대한 교육을 받았습니다. ChatGPT 및 기타 대규모 언어 모델은 주어진 프롬프트에 따라 텍스트를 생성할 수 있을 뿐이며 데이터 과학자가 보유한 다른 기술은 없습니다.
데이터 과학자는 작업 결과를 해석하고 설명할 수 있습니다. 데이터 과학자는 의사 결정 및 이해관계자와의 커뮤니케이션에 중요한 작업 결과를 해석하고 설명하도록 교육을 받았습니다. ChatGPT 및 기타 대규모 언어 모델은 작업 결과를 해석하거나 설명할 수 없습니다.
데이터 과학자는 광범위한 데이터로 작업할 수 있습니다. 데이터 과학자는 구조화된 데이터와 구조화되지 않은 데이터를 포함하여 광범위한 데이터를 작업하도록 교육을 받았으며 다양한 도구와 기술을 사용하여 데이터에서 통찰력을 추출할 수 있습니다. ChatGPT 및 기타 대규모 언어 모델은 주어진 프롬프트를 기반으로만 텍스트를 생성할 수 있으며 다른 유형의 데이터로는 작업할 수 없습니다.
데이터 과학자는 다양한 이해관계자와 협력할 수 있습니다. 데이터 과학자는 비즈니스 리더, 분야 전문가, 기술 전문가를 포함한 광범위한 이해관계자와 협력하도록 교육을 받았으며 복잡한 개념을 명확하고 이해하기 쉬운 방식으로 전달할 수 있습니다. 방법. ChatGPT 및 기타 대규모 언어 모델은 이해관계자와 협력하거나 복잡한 개념을 전달할 수 없습니다.
https://cognitiveclass.ai/
에서 IBM 개발자 및 데이터 과학자가 개발한 초보자 친화적인 가이드 프로젝트와 기타 무료 코스를 확인하세요.다음 시간까지!
위 내용은 무료 프로젝트: ChatGPT를 사용하여 Python 및 Matplotlib로 플롯의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!