目錄
範例
安裝方法
三大操作
首頁 後端開發 Python教學 妙啊!這款 Python 資料視覺化工具強的很!

妙啊!這款 Python 資料視覺化工具強的很!

Apr 15, 2023 am 09:28 AM
python 視覺化 程式碼

妙啊!這款 Python 資料視覺化工具強的很!

使用Altair ,你可以將更多時間專注於數據及其含義,下面我將詳細介紹:

範例

這是一個在JupyterLab 中使用Altair 快速視覺化和顯示資料集的範例:

import altair as alt
# load a simple dataset as a pandas DataFrame
from vega_datasets import data
cars = data.cars()
alt.Chart(cars).mark_point().encode(
x='Horsepower',
y='Miles_per_Gallon',
color='Origin',
)

登入後複製

妙啊!這款 Python 資料視覺化工具強的很!

源自Vega-Lite 的Altair 的獨特功能之一是聲明性語法,它不僅具有可視化功能,還具有互動性。透過對上面的範例進行一些修改,我們可以建立一個連結的直方圖,該直方圖根據散點圖的選擇進行過濾。

import altair as alt
from vega_datasets import data
source = data.cars()
brush = alt.selection(type='interval')
points = alt.Chart(source).mark_point().encode(
x='Horsepower',
y='Miles_per_Gallon',
color=alt.condition(brush, 'Origin', alt.value('lightgray'))
).add_selection(
brush
)
bars = alt.Chart(source).mark_bar().encode(
y='Origin',
color='Origin',
x='count(Origin)'
).transform_filter(
brush
)
points & bars

登入後複製

妙啊!這款 Python 資料視覺化工具強的很!

安裝方法

Altair需要以下相依性:

  • pandas
  •  traitlets
  • IPython

如果已複製儲存庫,請從儲存庫的根目錄執行下列指令:

pip install -e .[dev]

登入後複製

如果你不想複製儲存庫,則可以使用下列指令進行安裝:

pip install git+https://github.com/altair-viz/altair

登入後複製

更多內容詳情,可以查看github連結:

https://github.com/altair-viz/altair

登入後複製

三大操作

##接下來,我將詳細介紹Altair如何建立篩選、分組和合併作業的視覺化對象,可以將其用作探索性資料分析過程的一部分。

我們建構兩個資料幀的模擬資料。第一個是餐廳訂單,第二個是餐廳訂單中的商品價格。

# import libraries
import numpy as np
import pandas as pd
import altair as alt
import random
# mock data
orders = pd.DataFrame({
 "order_id": np.arange(1,101),
 "item": np.random.randint(1, 50, size=100),
 "qty": np.random.randint(1, 10, size=100),
 "tip": (np.random.random(100) * 10).round(2)
})
prices = pd.DataFrame({
 "item": np.arange(1,51),
 "price": (np.random.random(50) * 50).round(2)
})
order_type = ["lunch", "dinner"] * 50
random.shuffle(order_type)
orders["order_type"] = order_type

登入後複製

妙啊!這款 Python 資料視覺化工具強的很!

妙啊!這款 Python 資料視覺化工具強的很!

首先,我們建立一個簡單的圖來 Altair 語法結構。

alt.Chart(orders).mark_circle(size=50).encode(
 x="qty", y="tip", color="order_type"
).properties(
 title = "Tip vs Quantity"
)

登入後複製

妙啊!這款 Python 資料視覺化工具強的很!

Altair 基本語法四步曲:

    將資料傳遞到Chart 對象,資料可以採用Pandas資料框或指向json或csv文件的URL字串的形式。
  • 選擇可視化的類型(例如 mark_circle,mark_line 等)。
  • encode 編碼函數指定在給定資料幀中要繪製的內容。因此,我們在編碼函數中編寫的任何內容都必須連結到資料幀。
  • 使用properties函數指定圖的某些屬性。
考慮這樣一種情況,我們需要建立 pirce 和 tip 值的散佈圖,它們位於不同的資料幀中。一種選擇是合併兩個資料幀,並在散佈圖中使用這兩個欄位。

Altair提供了更實用的方法,它允許在其他資料框中尋找列, 類似 Pandas 的 merge 函數功能相同。

alt.Chart(orders).mark_circle(size=50).encode(
 x="tip", y="price:Q", color="order_type"
).transform_lookup(
 lookup="item",
 from_=alt.LookupData(data=prices, key="item", fields=["price"])
).properties(
 title = "Price vs Tip"
)

登入後複製

妙啊!這款 Python 資料視覺化工具強的很!

transform_lookup 函數類似於 Pandas 的 merge 函數。用於匹配觀察值的列(即行)將傳遞給lookup參數。 fields參數用於從另一個資料幀中選擇所需的列。

我們還可以把過濾組件整合到繪圖中,讓我們繪製價格超過10美元的數據點。

alt.Chart(orders).mark_circle(size=50).encode(
 x="tip", y="price:Q", color="order_type"
).transform_lookup(
 lookup="item",
 from_=alt.LookupData(data=prices, key="item", fields=["price"])
).transform_filter(
 alt.FieldGTPredicate(field='price', gt=10)
).properties(
 title = "Price vs Tip"
)

登入後複製

妙啊!這款 Python 資料視覺化工具強的很!

transform_filter 函數用於過濾。 FieldGTPredicate處理"大於"的條件。

除了過濾和合併外,Altair 還允許在繪圖之前對資料點進行分組。例如,我們可以建立一個長條圖來顯示每種訂單類型的商品平均價格。此外,我們可以對價格低於20美元的商品執行此操作。

alt.Chart(orders).mark_bar().encode(
 y="order_type", x="avg_price:Q"
).transform_lookup(
 lookup="item",
 from_=alt.LookupData(data=prices, key="item", fields=["price"])
).transform_filter(
 alt.FieldLTPredicate(field='price', lt=20)
).transform_aggregate(
 avg_price = "mean(price)", groupby = ["order_type"]
).properties(
 height=200, width=300
)

登入後複製

妙啊!這款 Python 資料視覺化工具強的很!

讓我們詳細說明每個步驟:

    transform_lookup:從價格資料框中找出價格。
  • transform_filter:過濾價格低於20美元的價格。
  • transform_aggregate:以訂單類型分組並計算平均值。
結論

Altair 與其他常見的視覺化函式庫的不同之處在於,它可以無縫地將資料分析元件整合到視覺化中,是一款非常實用的數據探索工具。

篩選、合併和分組對於探索性資料分析過程至關重要。 Altair 允許在建立資料視覺化時執行所有這些操作。從這個意義上講,Altair也可以視為資料分析工具。如果你有興趣,趕快試試看。

以上是妙啊!這款 Python 資料視覺化工具強的很!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

HadiDB:Python 中的輕量級、可水平擴展的數據庫 HadiDB:Python 中的輕量級、可水平擴展的數據庫 Apr 08, 2025 pm 06:12 PM

HadiDB:輕量級、高水平可擴展的Python數據庫HadiDB(hadidb)是一個用Python編寫的輕量級數據庫,具備高度水平的可擴展性。安裝HadiDB使用pip安裝:pipinstallhadidb用戶管理創建用戶:createuser()方法創建一個新用戶。 authentication()方法驗證用戶身份。 fromhadidb.operationimportuseruser_obj=user("admin","admin")user_obj.

2小時的Python計劃:一種現實的方法 2小時的Python計劃:一種現實的方法 Apr 11, 2025 am 12:04 AM

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

Navicat查看MongoDB數據庫密碼的方法 Navicat查看MongoDB數據庫密碼的方法 Apr 08, 2025 pm 09:39 PM

直接通過 Navicat 查看 MongoDB 密碼是不可能的,因為它以哈希值形式存儲。取回丟失密碼的方法:1. 重置密碼;2. 檢查配置文件(可能包含哈希值);3. 檢查代碼(可能硬編碼密碼)。

Python:探索其主要應用程序 Python:探索其主要應用程序 Apr 10, 2025 am 09:41 AM

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

如何針對高負載應用程序優化 MySQL 性能? 如何針對高負載應用程序優化 MySQL 性能? Apr 08, 2025 pm 06:03 PM

MySQL數據庫性能優化指南在資源密集型應用中,MySQL數據庫扮演著至關重要的角色,負責管理海量事務。然而,隨著應用規模的擴大,數據庫性能瓶頸往往成為製約因素。本文將探討一系列行之有效的MySQL性能優化策略,確保您的應用在高負載下依然保持高效響應。我們將結合實際案例,深入講解索引、查詢優化、數據庫設計以及緩存等關鍵技術。 1.數據庫架構設計優化合理的數據庫架構是MySQL性能優化的基石。以下是一些核心原則:選擇合適的數據類型選擇最小的、符合需求的數據類型,既能節省存儲空間,又能提升數據處理速度

如何將 AWS Glue 爬網程序與 Amazon Athena 結合使用 如何將 AWS Glue 爬網程序與 Amazon Athena 結合使用 Apr 09, 2025 pm 03:09 PM

作為數據專業人員,您需要處理來自各種來源的大量數據。這可能會給數據管理和分析帶來挑戰。幸運的是,兩項 AWS 服務可以提供幫助:AWS Glue 和 Amazon Athena。

redis怎麼啟動服務器 redis怎麼啟動服務器 Apr 10, 2025 pm 08:12 PM

啟動 Redis 服務器的步驟包括:根據操作系統安裝 Redis。通過 redis-server(Linux/macOS)或 redis-server.exe(Windows)啟動 Redis 服務。使用 redis-cli ping(Linux/macOS)或 redis-cli.exe ping(Windows)命令檢查服務狀態。使用 Redis 客戶端,如 redis-cli、Python 或 Node.js,訪問服務器。

redis怎麼讀取隊列 redis怎麼讀取隊列 Apr 10, 2025 pm 10:12 PM

要從 Redis 讀取隊列,需要獲取隊列名稱、使用 LPOP 命令讀取元素,並處理空隊列。具體步驟如下:獲取隊列名稱:以 "queue:" 前綴命名,如 "queue:my-queue"。使用 LPOP 命令:從隊列頭部彈出元素並返回其值,如 LPOP queue:my-queue。處理空隊列:如果隊列為空,LPOP 返回 nil,可先檢查隊列是否存在再讀取元素。

See all articles