아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!
알테어를 사용하면 데이터와 그 의미에 더 많은 시간을 집중할 수 있습니다. 이에 대해서는 아래에서 자세히 설명하겠습니다.
예
다음은 JupyterLab에서 알테어를 사용하여 데이터 세트를 빠르게 시각화하고 표시하는 예입니다.
import altair as alt # load a simple dataset as a pandas DataFrame from vega_datasets import data cars = data.cars() alt.Chart(cars).mark_point().encode( x='Horsepower', y='Miles_per_Gallon', color='Origin', )
Vega-Lite Altair의 독특한 기능 중 하나는 시각적일 뿐만 아니라 대화형인 선언적 구문입니다. 위의 예를 일부 수정하면 산점도 선택에 따라 필터링되는 연결된 히스토그램을 만들 수 있습니다.
import altair as alt from vega_datasets import data source = data.cars() brush = alt.selection(type='interval') points = alt.Chart(source).mark_point().encode( x='Horsepower', y='Miles_per_Gallon', color=alt.condition(brush, 'Origin', alt.value('lightgray')) ).add_selection( brush ) bars = alt.Chart(source).mark_bar().encode( y='Origin', color='Origin', x='count(Origin)' ).transform_filter( brush ) points & bars
설치 방법
Altair에는 다음 종속성이 필요합니다.
- pandas
- traitlets
- IPython
저장소를 복제한 경우 저장소 루트에서 다음 명령을 실행하세요.
pip install -e .[dev]
저장소를 복제하지 않으려면 다음 명령을 사용하여 설치할 수 있습니다.
pip install git+https://github.com/altair-viz/altair
자세한 내용은 github 링크를 참조하세요.
https://github.com/altair-viz/altair
세 가지 주요 작업
다음에는 알테어가 탐색적 데이터 분석 프로세스의 일부로 사용할 수 있는 그룹화 및 병합 작업을 위한 필터, 시각적 객체를 생성하는 방법을 자세히 소개합니다.
우리는 시뮬레이션된 데이터로 두 개의 데이터 프레임을 구성합니다. 첫 번째는 레스토랑 주문이고, 두 번째는 레스토랑 주문에 포함된 품목의 가격입니다.
# import libraries import numpy as np import pandas as pd import altair as alt import random # mock data orders = pd.DataFrame({ "order_id": np.arange(1,101), "item": np.random.randint(1, 50, size=100), "qty": np.random.randint(1, 10, size=100), "tip": (np.random.random(100) * 10).round(2) }) prices = pd.DataFrame({ "item": np.arange(1,51), "price": (np.random.random(50) * 50).round(2) }) order_type = ["lunch", "dinner"] * 50 random.shuffle(order_type) orders["order_type"] = order_type
먼저 알테어 구문 구조에 대한 간단한 다이어그램을 만듭니다.
alt.Chart(orders).mark_circle(size=50).encode( x="qty", y="tip", color="order_type" ).properties( title = "Tip vs Quantity" )
4단계로 구성된 Altair 기본 구문:
- 데이터를 Chart 개체에 전달합니다. 이 개체는 Pandas 데이터 프레임 또는 json 또는 csv 파일을 가리키는 URL 문자열 형식일 수 있습니다.
- 시각화 유형(예: mark_circle, mark_line 등)을 선택하세요.
- encode 인코딩 함수는 주어진 데이터 프레임에 무엇을 그릴지 지정합니다. 따라서 인코딩 함수에 작성하는 모든 항목은 데이터프레임에 연결되어야 합니다.
- 그래프의 특정 속성을 지정하려면 속성 함수를 사용하세요.
서로 다른 데이터 프레임에 있는 pirce 값과 팁 값의 산점도를 생성해야 하는 상황을 생각해 보세요. 한 가지 옵션은 두 데이터프레임을 병합하고 이 두 열을 분산형 차트에 사용하는 것입니다.
Altair는 Pandas의 병합 기능과 유사하게 다른 데이터 프레임에서 열을 찾을 수 있는 보다 실용적인 방법을 제공합니다.
alt.Chart(orders).mark_circle(size=50).encode( x="tip", y="price:Q", color="order_type" ).transform_lookup( lookup="item", from_=alt.LookupData(data=prices, key="item", fields=["price"]) ).properties( title = "Price vs Tip" )
Transform_lookup 기능은 Pandas의 병합 기능과 유사합니다. 관측치를 일치시키는 데 사용되는 열(즉, 행)은 조회 매개변수에 전달됩니다. fields 매개변수는 다른 데이터프레임에서 필요한 열을 선택하는 데 사용됩니다.
또한 필터 구성 요소를 플롯에 통합하여 $10 이상의 가격으로 데이터 포인트를 플롯할 수 있습니다.
alt.Chart(orders).mark_circle(size=50).encode( x="tip", y="price:Q", color="order_type" ).transform_lookup( lookup="item", from_=alt.LookupData(data=prices, key="item", fields=["price"]) ).transform_filter( alt.FieldGTPredicate(field='price', gt=10) ).properties( title = "Price vs Tip" )
필터링에는 변환 필터 기능이 사용됩니다. FieldGTPredicate는 "보다 큼" 조건을 처리합니다.
알테어는 필터링 및 병합 외에도 데이터 포인트를 플롯하기 전에 그룹화할 수 있습니다. 예를 들어, 각 주문 유형에 대한 품목의 평균 가격을 표시하는 막대 차트를 만들 수 있습니다. 또한 가격이 20달러 미만인 품목에 대해서도 이 작업을 수행할 수 있습니다.
alt.Chart(orders).mark_bar().encode( y="order_type", x="avg_price:Q" ).transform_lookup( lookup="item", from_=alt.LookupData(data=prices, key="item", fields=["price"]) ).transform_filter( alt.FieldLTPredicate(field='price', lt=20) ).transform_aggregate( avg_price = "mean(price)", groupby = ["order_type"] ).properties( height=200, width=300 )
각 단계를 자세히 설명하겠습니다.
- Transform_lookup: 가격 데이터 프레임에서 가격을 찾습니다.
- 변환_필터: $20 미만의 가격을 필터링합니다.
- Transform_aggregate: 주문 유형별로 가격을 그룹화하고 평균을 계산합니다.
결론
알테어와 다른 일반적인 시각화 라이브러리의 차이점은 데이터 분석 구성 요소를 시각화에 원활하게 통합할 수 있어 매우 실용적인 데이터 탐색 도구가 된다는 것입니다.
탐색적 데이터 분석 프로세스에서는 필터링, 병합 및 그룹화가 중요합니다. 알테어를 사용하면 데이터 시각화를 생성할 때 이러한 모든 작업을 수행할 수 있습니다. 이런 의미에서 알테어는 데이터 분석 도구로도 간주될 수 있습니다. 관심이 있으시다면 지금 바로 사용해 보세요.
위 내용은 아주 멋진! 이 Python 데이터 시각화 도구는 강력합니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











HADIDB : 가볍고 높은 수준의 확장 가능한 Python 데이터베이스 HadIDB (HADIDB)는 파이썬으로 작성된 경량 데이터베이스이며 확장 수준이 높습니다. PIP 설치를 사용하여 HADIDB 설치 : PIPINSTALLHADIDB 사용자 관리 사용자 만들기 사용자 : createUser () 메소드를 작성하여 새 사용자를 만듭니다. Authentication () 메소드는 사용자의 신원을 인증합니다. Fromhadidb.operationimportuseruser_obj = user ( "admin", "admin") user_obj.

해시 값으로 저장되기 때문에 MongoDB 비밀번호를 Navicat을 통해 직접 보는 것은 불가능합니다. 분실 된 비밀번호 검색 방법 : 1. 비밀번호 재설정; 2. 구성 파일 확인 (해시 값이 포함될 수 있음); 3. 코드를 점검하십시오 (암호 하드 코드 메일).

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

MySQL 데이터베이스 성능 최적화 안내서 리소스 집약적 응용 프로그램에서 MySQL 데이터베이스는 중요한 역할을 수행하며 대규모 트랜잭션 관리를 담당합니다. 그러나 응용 프로그램 규모가 확장됨에 따라 데이터베이스 성능 병목 현상은 종종 제약이됩니다. 이 기사는 일련의 효과적인 MySQL 성능 최적화 전략을 탐색하여 응용 프로그램이 고 부하에서 효율적이고 반응이 유지되도록합니다. 실제 사례를 결합하여 인덱싱, 쿼리 최적화, 데이터베이스 설계 및 캐싱과 같은 심층적 인 주요 기술을 설명합니다. 1. 데이터베이스 아키텍처 설계 및 최적화 된 데이터베이스 아키텍처는 MySQL 성능 최적화의 초석입니다. 몇 가지 핵심 원칙은 다음과 같습니다. 올바른 데이터 유형을 선택하고 요구 사항을 충족하는 가장 작은 데이터 유형을 선택하면 저장 공간을 절약 할 수있을뿐만 아니라 데이터 처리 속도를 향상시킬 수 있습니다.

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 같은 작업에 적합합니다.

데이터 전문가는 다양한 소스에서 많은 양의 데이터를 처리해야합니다. 이것은 데이터 관리 및 분석에 어려움을 겪을 수 있습니다. 다행히도 AWS Glue와 Amazon Athena의 두 가지 AWS 서비스가 도움이 될 수 있습니다.

Redis 서버를 시작하는 단계에는 다음이 포함됩니다. 운영 체제에 따라 Redis 설치. Redis-Server (Linux/MacOS) 또는 Redis-Server.exe (Windows)를 통해 Redis 서비스를 시작하십시오. Redis-Cli Ping (Linux/MacOS) 또는 Redis-Cli.exe Ping (Windows) 명령을 사용하여 서비스 상태를 확인하십시오. Redis-Cli, Python 또는 Node.js와 같은 Redis 클라이언트를 사용하여 서버에 액세스하십시오.

아니요, MySQL은 SQL Server에 직접 연결할 수 없습니다. 그러나 다음 방법을 사용하여 데이터 상호 작용을 구현할 수 있습니다. 미들웨어 사용 : MySQL에서 중간 형식으로 데이터를 내보낸 다음 미들웨어를 통해 SQL Server로 가져옵니다. 데이터베이스 링커 사용 : 비즈니스 도구는 본질적으로 미들웨어를 통해 여전히 구현되는보다 우호적 인 인터페이스와 고급 기능을 제공합니다.
