Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !

WBOY
Freigeben: 2023-04-12 11:28:15
nach vorne
1212 Leute haben es durchsucht

Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !

Was ist Altair?

Altair wird als statistische Visualisierungsbibliothek bezeichnet, da es Daten durch Klassifizierung und Aggregation, Datentransformation, Dateninteraktion, grafische Zusammensetzung usw. umfassend verstehen, verstehen und analysieren kann und der Installationsprozess ebenfalls ist Ganz einfach. Es kann direkt über den Pip-Befehl wie folgt ausgeführt werden:

pip install altair
pip install vega_datasets
pip install altair_viewer
Nach dem Login kopieren

Wenn Sie den Conda-Paketmanager verwenden, um das Altair-Modul zu installieren, lautet der Code wie folgt:

conda install -c conda-forge altair vega_datasets
Nach dem Login kopieren

AltairInitial Experience

Versuchen wir einfach, ein Histogramm zu zeichnen. Erstellen Sie zunächst einen DataFrame-Datensatz:

df = pd.DataFrame({"brand":["iPhone","Xiaomi","HuaWei","Vivo"],
"profit(B)":[200,55,88,60]})
Nach dem Login kopieren

Der nächste Schritt ist Code zum Zeichnen des Histogramms: # 🎜🎜#

import altair as alt
import pandas as pd
import altair_viewer
chart = alt.Chart(df).mark_bar().encode(x="brand:N",y="profit(B):Q")
# 展示数据,调用display()方法
altair_viewer.display(chart,inline=True)
Nach dem Login kopieren

output

Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !

Verwenden Sie aus Sicht der gesamten Syntaxstruktur zunächst alt.Chart (), um den zu verwendenden Datensatz anzugeben. Verwenden Sie dann die Instanzmethode mark_*(), um den Diagrammstil zu zeichnen, und geben Sie schließlich die durch die X-Achse und die Y-Achse dargestellten Daten an. Sie sind möglicherweise neugierig, was N und Q steht für bzw. Dies ist die Abkürzung für den Variablentyp. Mit anderen Worten, das Altair-Modul muss die beim Zeichnen von Grafiken beteiligten Variablentypen verstehen.

Das N stellt eine Nominalvariable (Nominal) dar. Beispielsweise sind die Marken von Mobiltelefonen alle Eigennamen, während Q eine numerische Variable (Quantitativ) darstellt, die in diskrete Typdaten unterteilt werden kann (). Diskrete) und kontinuierliche Daten (kontinuierlich). Darüber hinaus gibt es Zeitreihendaten, die Abkürzung ist T und ordinale Variablen (O). Im Online-Einkaufsprozess gibt es beispielsweise 1-5-Bewertungen für Händler.

Speichern Sie das Diagramm

Um das endgültige Diagramm zu speichern, können wir die Methode save() direkt aufrufen, um das Objekt als HTML-Datei zu speichern. Der Code lautet wie folgt: # 🎜🎜#
chart.save("chart.html")
Nach dem Login kopieren

kann auch als JSON-Datei gespeichert werden, was vom Code her sehr ähnlich ist.

chart.save("chart.json")
Nach dem Login kopieren

Natürlich können wir Dateien auch im Bildformat speichern, wie unten gezeigt:

Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !Erweiterte Funktionen von Altair #🎜 🎜#

Basierend auf dem oben Gesagten werden wir es weiter ableiten und erweitern. Beispielsweise möchten wir ein horizontales Balkendiagramm zeichnen und Daten auf der X-Achse und der Y-Achse austauschen. 🎜🎜#
chart = alt.Chart(df).mark_bar().encode(x="profit(B):Q", y="brand:N")
chart.save("chart1.html")
Nach dem Login kopieren

output

Gleichzeitig versuchen wir auch, ein Liniendiagramm zu zeichnen wird wie folgt aufgerufen:

## 创建一组新的数据,以日期为行索引值
np.random.seed(29)
value = np.random.randn(365)
data = np.cumsum(value)
date = pd.date_range(start="20220101", end="20221231")
df = pd.DataFrame({"num": data}, index=date)
line_chart = alt.Chart(df.reset_index()).mark_line().encode(x="index:T", y="num:Q")
line_chart.save("chart2.html")
Nach dem Login kopieren
Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !output

Wir können auch ein Gantt-Diagramm zeichnen, einen Vergleich, der normalerweise im Projektmanagement verwendet wird. Mehr , die X-Achse fügt Zeit und Datum hinzu, während die Y-Achse den Fortschritt des Projekts darstellt. Der Code lautet wie folgt:

project = [{"project": "Proj1", "start_time": "2022-01-16", "end_time": "2022-03-20"},
{"project": "Proj2", "start_time": "2022-04-12", "end_time": "2022-11-20"},
......
]
df = alt.Data(values=project)
chart = alt.Chart(df).mark_bar().encode(
 alt.X("start_time:T",
 axis=alt.Axis(format="%x",
 formatType="time",
 tickCount=3),
 scale=alt.Scale(domain=[alt.DateTime(year=2022, month=1, date=1),
 alt.DateTime(year=2022, month=12, date=1)])),
 alt.X2("end_time:T"),
 alt.Y("project:N", axis=alt.Axis(labelAlign="left",
labelFontSize=15,
labelOffset=0,
labelPadding=50)),
 color=alt.Color("project:N", legend=alt.Legend(labelFontSize=12,
symbolOpacity=0.7,
titleFontSize=15)))
chart.save("chart_gantt.html")
Nach dem Login kopieren
Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !output

#🎜🎜 #

Auf dem Bild oben können wir mehrere Projekte sehen, an denen das Team arbeitet. Natürlich ist auch die Zeitspanne der verschiedenen Projekte unterschiedlich Das Diagramm sieht sehr intuitiv aus.

Als nächstes zeichnen wir das Streudiagramm und rufen die Methode mark_circle() auf. Der Code lautet wie folgt: Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !

df = data.cars()
## 筛选出地区是“USA”也就是美国的乘用车数据
df_1 = alt.Chart(df).transform_filter(
 alt.datum.Origin == "USA"
)
df = data.cars()
df_1 = alt.Chart(df).transform_filter(
 alt.datum.Origin == "USA"
)
chart = df_1.mark_circle().encode(
 alt.X("Horsepower:Q"),
 alt.Y("Miles_per_Gallon:Q")
)
chart.save("chart_dots.html")
Nach dem Login kopieren

output

#🎜🎜 #

Natürlich können wir es weiter optimieren, um das Diagramm schöner zu machen und einige Farben hinzuzufügen. Der Code lautet wie folgt:

chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0),
alt.GradientStop("red", 1.0)]),
 size=160).encode(
 alt.X("Horsepower:Q", scale=alt.Scale(zero=False,padding=20)),
 alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False,padding=20))
)
Nach dem Login kopieren

output

#🎜🎜 #Teilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !

Wir ändern die Größe der Streupunkte. Die Größen der verschiedenen Streupunkte stellen unterschiedliche Werte dar. Der Code lautet wie folgt:

chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0),
alt.GradientStop("red", 1.0)]),
 size=160).encode(
 alt.X("Horsepower:Q", scale=alt.Scale(zero=False, padding=20)),
 alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False, padding=20)),
 size="Acceleration:Q"
)
Nach dem Login kopieren

output#🎜 🎜##🎜 🎜#

Das obige ist der detaillierte Inhalt vonTeilen Sie ein beliebtes Python-Visualisierungsmodul, einfach und schnell loslegen! !. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!