아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!-파이썬 튜토리얼-php.cn

예

설치 방법

세 가지 주요 작업

결론

집

백엔드 개발

파이썬 튜토리얼

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

PHPz

Apr 15, 2023 am 09:28 AM

python 심상 암호

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

알테어를 사용하면 데이터와 그 의미에 더 많은 시간을 집중할 수 있습니다. 이에 대해서는 아래에서 자세히 설명하겠습니다.

예

다음은 JupyterLab에서 알테어를 사용하여 데이터 세트를 빠르게 시각화하고 표시하는 예입니다.

import altair as alt
# load a simple dataset as a pandas DataFrame
from vega_datasets import data
cars = data.cars()
alt.Chart(cars).mark_point().encode(
x='Horsepower',
y='Miles_per_Gallon',
color='Origin',
)

로그인 후 복사

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

Vega-Lite Altair의 독특한 기능 중 하나는 시각적일 뿐만 아니라 대화형인 선언적 구문입니다. 위의 예를 일부 수정하면 산점도 선택에 따라 필터링되는 연결된 히스토그램을 만들 수 있습니다.

import altair as alt
from vega_datasets import data
source = data.cars()
brush = alt.selection(type='interval')
points = alt.Chart(source).mark_point().encode(
x='Horsepower',
y='Miles_per_Gallon',
color=alt.condition(brush, 'Origin', alt.value('lightgray'))
).add_selection(
brush
)
bars = alt.Chart(source).mark_bar().encode(
y='Origin',
color='Origin',
x='count(Origin)'
).transform_filter(
brush
)
points & bars

로그인 후 복사

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

설치 방법

Altair에는 다음 종속성이 필요합니다.

pandas
traitlets
IPython

저장소를 복제한 경우 저장소 루트에서 다음 명령을 실행하세요.

pip install -e .[dev]

로그인 후 복사

저장소를 복제하지 않으려면 다음 명령을 사용하여 설치할 수 있습니다.

pip install git+https://github.com/altair-viz/altair

로그인 후 복사

자세한 내용은 github 링크를 참조하세요.

https://github.com/altair-viz/altair

로그인 후 복사

세 가지 주요 작업

다음에는 알테어가 탐색적 데이터 분석 프로세스의 일부로 사용할 수 있는 그룹화 및 병합 작업을 위한 필터, 시각적 객체를 생성하는 방법을 자세히 소개합니다.

우리는 시뮬레이션된 데이터로 두 개의 데이터 프레임을 구성합니다. 첫 번째는 레스토랑 주문이고, 두 번째는 레스토랑 주문에 포함된 품목의 가격입니다.

# import libraries
import numpy as np
import pandas as pd
import altair as alt
import random
# mock data
orders = pd.DataFrame({
 "order_id": np.arange(1,101),
 "item": np.random.randint(1, 50, size=100),
 "qty": np.random.randint(1, 10, size=100),
 "tip": (np.random.random(100) * 10).round(2)
})
prices = pd.DataFrame({
 "item": np.arange(1,51),
 "price": (np.random.random(50) * 50).round(2)
})
order_type = ["lunch", "dinner"] * 50
random.shuffle(order_type)
orders["order_type"] = order_type

로그인 후 복사

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

먼저 알테어 구문 구조에 대한 간단한 다이어그램을 만듭니다.

alt.Chart(orders).mark_circle(size=50).encode(
 x="qty", y="tip", color="order_type"
).properties(
 title = "Tip vs Quantity"
)

로그인 후 복사

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

4단계로 구성된 Altair 기본 구문:

데이터를 Chart 개체에 전달합니다. 이 개체는 Pandas 데이터 프레임 또는 json 또는 csv 파일을 가리키는 URL 문자열 형식일 수 있습니다.
시각화 유형(예: mark_circle, mark_line 등)을 선택하세요.
encode 인코딩 함수는 주어진 데이터 프레임에 무엇을 그릴지 지정합니다. 따라서 인코딩 함수에 작성하는 모든 항목은 데이터프레임에 연결되어야 합니다.
그래프의 특정 속성을 지정하려면 속성 함수를 사용하세요.

서로 다른 데이터 프레임에 있는 pirce 값과 팁 값의 산점도를 생성해야 하는 상황을 생각해 보세요. 한 가지 옵션은 두 데이터프레임을 병합하고 이 두 열을 분산형 차트에 사용하는 것입니다.

Altair는 Pandas의 병합 기능과 유사하게 다른 데이터 프레임에서 열을 찾을 수 있는 보다 실용적인 방법을 제공합니다.

alt.Chart(orders).mark_circle(size=50).encode(
 x="tip", y="price:Q", color="order_type"
).transform_lookup(
 lookup="item",
 from_=alt.LookupData(data=prices, key="item", fields=["price"])
).properties(
 title = "Price vs Tip"
)

로그인 후 복사

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

Transform_lookup 기능은 Pandas의 병합 기능과 유사합니다. 관측치를 일치시키는 데 사용되는 열(즉, 행)은 조회 매개변수에 전달됩니다. fields 매개변수는 다른 데이터프레임에서 필요한 열을 선택하는 데 사용됩니다.

또한 필터 구성 요소를 플롯에 통합하여 $10 이상의 가격으로 데이터 포인트를 플롯할 수 있습니다.

alt.Chart(orders).mark_circle(size=50).encode(
 x="tip", y="price:Q", color="order_type"
).transform_lookup(
 lookup="item",
 from_=alt.LookupData(data=prices, key="item", fields=["price"])
).transform_filter(
 alt.FieldGTPredicate(field='price', gt=10)
).properties(
 title = "Price vs Tip"
)

로그인 후 복사

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

필터링에는 변환 필터 기능이 사용됩니다. FieldGTPredicate는 "보다 큼" 조건을 처리합니다.

알테어는 필터링 및 병합 외에도 데이터 포인트를 플롯하기 전에 그룹화할 수 있습니다. 예를 들어, 각 주문 유형에 대한 품목의 평균 가격을 표시하는 막대 차트를 만들 수 있습니다. 또한 가격이 20달러 미만인 품목에 대해서도 이 작업을 수행할 수 있습니다.

alt.Chart(orders).mark_bar().encode(
 y="order_type", x="avg_price:Q"
).transform_lookup(
 lookup="item",
 from_=alt.LookupData(data=prices, key="item", fields=["price"])
).transform_filter(
 alt.FieldLTPredicate(field='price', lt=20)
).transform_aggregate(
 avg_price = "mean(price)", groupby = ["order_type"]
).properties(
 height=200, width=300
)

로그인 후 복사

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

각 단계를 자세히 설명하겠습니다.

Transform_lookup: 가격 데이터 프레임에서 가격을 찾습니다.
변환_필터: $20 미만의 가격을 필터링합니다.
Transform_aggregate: 주문 유형별로 가격을 그룹화하고 평균을 계산합니다.

결론

알테어와 다른 일반적인 시각화 라이브러리의 차이점은 데이터 분석 구성 요소를 시각화에 원활하게 통합할 수 있어 매우 실용적인 데이터 탐색 도구가 된다는 것입니다.

탐색적 데이터 분석 프로세스에서는 필터링, 병합 및 그룹화가 중요합니다. 알테어를 사용하면 데이터 시각화를 생성할 때 이러한 모든 작업을 수행할 수 있습니다. 이런 의미에서 알테어는 데이터 분석 도구로도 간주될 수 있습니다. 관심이 있으시다면 지금 바로 사용해 보세요.

위 내용은 아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7503

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

hadidb : 파이썬의 가볍고 수평 확장 가능한 데이터베이스 Apr 08, 2025 pm 06:12 PM

HADIDB : 가볍고 높은 수준의 확장 가능한 Python 데이터베이스 HadIDB (HADIDB)는 파이썬으로 작성된 경량 데이터베이스이며 확장 수준이 높습니다. PIP 설치를 사용하여 HADIDB 설치 : PIPINSTALLHADIDB 사용자 관리 사용자 만들기 사용자 : createUser () 메소드를 작성하여 새 사용자를 만듭니다. Authentication () 메소드는 사용자의 신원을 인증합니다. Fromhadidb.operationimportuseruser_obj = user ( "admin", "admin") user_obj.

MongoDB 데이터베이스 비밀번호를 보는 Navicat의 방법 Apr 08, 2025 pm 09:39 PM

해시 값으로 저장되기 때문에 MongoDB 비밀번호를 Navicat을 통해 직접 보는 것은 불가능합니다. 분실 된 비밀번호 검색 방법 : 1. 비밀번호 재설정; 2. 구성 파일 확인 (해시 값이 포함될 수 있음); 3. 코드를 점검하십시오 (암호 하드 코드 메일).

2 시간의 파이썬 계획 : 현실적인 접근 Apr 11, 2025 am 12:04 AM

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

고로드 애플리케이션의 MySQL 성능을 최적화하는 방법은 무엇입니까? Apr 08, 2025 pm 06:03 PM

MySQL 데이터베이스 성능 최적화 안내서 리소스 집약적 응용 프로그램에서 MySQL 데이터베이스는 중요한 역할을 수행하며 대규모 트랜잭션 관리를 담당합니다. 그러나 응용 프로그램 규모가 확장됨에 따라 데이터베이스 성능 병목 현상은 종종 제약이됩니다. 이 기사는 일련의 효과적인 MySQL 성능 최적화 전략을 탐색하여 응용 프로그램이 고 부하에서 효율적이고 반응이 유지되도록합니다. 실제 사례를 결합하여 인덱싱, 쿼리 최적화, 데이터베이스 설계 및 캐싱과 같은 심층적 인 주요 기술을 설명합니다. 1. 데이터베이스 아키텍처 설계 및 최적화 된 데이터베이스 아키텍처는 MySQL 성능 최적화의 초석입니다. 몇 가지 핵심 원칙은 다음과 같습니다. 올바른 데이터 유형을 선택하고 요구 사항을 충족하는 가장 작은 데이터 유형을 선택하면 저장 공간을 절약 할 수있을뿐만 아니라 데이터 처리 속도를 향상시킬 수 있습니다.

파이썬 : 기본 응용 프로그램 탐색 Apr 10, 2025 am 09:41 AM

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 같은 작업에 적합합니다.

Amazon Athena와 함께 AWS Glue Crawler를 사용하는 방법 Apr 09, 2025 pm 03:09 PM

데이터 전문가는 다양한 소스에서 많은 양의 데이터를 처리해야합니다. 이것은 데이터 관리 및 분석에 어려움을 겪을 수 있습니다. 다행히도 AWS Glue와 Amazon Athena의 두 가지 AWS 서비스가 도움이 될 수 있습니다.

Redis로 서버를 시작하는 방법 Apr 10, 2025 pm 08:12 PM

Redis 서버를 시작하는 단계에는 다음이 포함됩니다. 운영 체제에 따라 Redis 설치. Redis-Server (Linux/MacOS) 또는 Redis-Server.exe (Windows)를 통해 Redis 서비스를 시작하십시오. Redis-Cli Ping (Linux/MacOS) 또는 Redis-Cli.exe Ping (Windows) 명령을 사용하여 서비스 상태를 확인하십시오. Redis-Cli, Python 또는 Node.js와 같은 Redis 클라이언트를 사용하여 서버에 액세스하십시오.

MySQL이 SQL 서버에 연결할 수 있습니다 Apr 08, 2025 pm 05:54 PM

아니요, MySQL은 SQL Server에 직접 연결할 수 없습니다. 그러나 다음 방법을 사용하여 데이터 상호 작용을 구현할 수 있습니다. 미들웨어 사용 : MySQL에서 중간 형식으로 데이터를 내보낸 다음 미들웨어를 통해 SQL Server로 가져옵니다. 데이터베이스 링커 사용 : 비즈니스 도구는 본질적으로 미들웨어를 통해 여전히 구현되는보다 우호적 인 인터페이스와 고급 기능을 제공합니다.

See all articles

아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!

예

설치 방법

세 가지 주요 작업

결론

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제