다음과 같은 간단한 DataFrame이 있다고 가정해 보겠습니다. 다음은 다음과 같습니다.
import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)], 'B': [randint(1, 9)*10 for x in range(10)], 'C': [randint(1, 9)*100 for x in range(10)]})
우리의 목표는 'A' 열에서 다음을 충족하는 값을 선택하는 것입니다. 'B' 및 'C' 열의 해당 값에 대한 특정 기준.
이를 달성하기 위해 부울 인덱싱을 활용할 수 있습니다. 먼저 각 기준에 대한 부울 시리즈 객체를 생성합니다.
df["B"] > 50 (df["B"] > 50) & (df["C"] != 900)
이 부울 시리즈는 해당 기준을 충족하는 행을 나타냅니다. 그런 다음 이 시리즈를 인덱스로 사용하여 원하는 값을 선택할 수 있습니다.
df["A"][df["B"] > 50] df["A"][(df["B"] > 50) & (df["C"] != 900)]
보다 효율적인 인덱싱을 위해 .loc 속성을 사용할 수도 있습니다. .loc를 사용하면 단일 문을 사용하여 검색할 행과 열을 지정할 수 있습니다.
df.loc[(df["B"] > 50) & (df["C"] != 900), "A"]
두 방법 모두 복잡한 기준에 따라 DataFrame에서 값을 효과적으로 선택합니다. 부울 인덱싱과 .loc 중 하나를 선택하는 것은 개인 취향과 코드 가독성에 따라 다릅니다.
위 내용은 Pandas에서 여러 기준에 따라 DataFrame 값을 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!