Pandas에서 여러 기준에 따라 DataFrame 값을 선택하는 방법은 무엇입니까?-파이썬 튜토리얼-php.cn

Pandas에서 여러 기준에 따라 DataFrame 값을 선택하는 방법은 무엇입니까?

Patricia Arquette

풀어 주다： 2024-12-05 13:09:10

원래의

935명이 탐색했습니다.

How to Select DataFrame Values Based on Multiple Criteria in Pandas?

pandas.DataFrame에서 복잡한 기준으로 선택

여러 기준을 기반으로 DataFrame에서 특정 값 선택

다음과 같은 간단한 DataFrame이 있다고 가정해 보겠습니다. 다음은 다음과 같습니다.

import pandas as pd
from random import randint

df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)],
                   'B': [randint(1, 9)*10 for x in range(10)],
                   'C': [randint(1, 9)*100 for x in range(10)]})

로그인 후 복사

우리의 목표는 'A' 열에서 다음을 충족하는 값을 선택하는 것입니다. 'B' 및 'C' 열의 해당 값에 대한 특정 기준.

부울 인덱싱을 사용한 접근 방식

이를 달성하기 위해 부울 인덱싱을 활용할 수 있습니다. 먼저 각 기준에 대한 부울 시리즈 객체를 생성합니다.

df["B"] > 50
(df["B"] > 50) & (df["C"] != 900)

로그인 후 복사

이 부울 시리즈는 해당 기준을 충족하는 행을 나타냅니다. 그런 다음 이 시리즈를 인덱스로 사용하여 원하는 값을 선택할 수 있습니다.

df["A"][df["B"] > 50]
df["A"][(df["B"] > 50) & (df["C"] != 900)]

로그인 후 복사

.loc를 사용한 접근 방식

보다 효율적인 인덱싱을 위해 .loc 속성을 사용할 수도 있습니다. .loc를 사용하면 단일 문을 사용하여 검색할 행과 열을 지정할 수 있습니다.

df.loc[(df["B"] > 50) & (df["C"] != 900), "A"]

로그인 후 복사

결론

두 방법 모두 복잡한 기준에 따라 DataFrame에서 값을 효과적으로 선택합니다. 부울 인덱싱과 .loc 중 하나를 선택하는 것은 개인 취향과 코드 가독성에 따라 다릅니다.

위 내용은 Pandas에서 여러 기준에 따라 DataFrame 값을 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!