지역 사회

배우다

도구 라이브러리

AI 도구

여가

한국어

집 > 데이터 베이스 > MySQL 튜토리얼 > Spark DataFrame에서 각 그룹의 상위 N개 레코드를 얻는 방법은 무엇입니까?

Spark DataFrame에서 각 그룹의 상위 N개 레코드를 얻는 방법은 무엇입니까?

DDD

풀어 주다： 2024-12-23 11:46:36

원래의

545명이 탐색했습니다.

How to Get the Top N Records for Each Group in a Spark DataFrame?

DataFrame에서 각 그룹의 상위 N 가져오기

Spark DataFrame에서는 특정 열을 기준으로 데이터를 그룹화하고 상위 항목을 검색해야 하는 경우가 많습니다. 각 그룹의 N개 레코드입니다. 예를 들어, 사용자 항목 등급 데이터가 있는 DataFrame이 있고 각 사용자에 대해 최고 등급 항목을 찾으려고 합니다.

Scala 솔루션

The Scala 이 문제에 대한 해결책은 순위 창 함수를 사용하는 것입니다. 이를 수행하는 방법은 다음과 같습니다.

상위 N 값 정의:
```
val n: Int = ???
```
로그인 후 복사
사용자가 데이터를 분할하는 창 정의를 만듭니다. 열을 선택하고 레코드의 내림차순으로 순위를 매깁니다. 평가:
```
val w = Window.partitionBy($"user").orderBy(desc("rating"))
```
로그인 후 복사
순위 함수를 사용하여 DataFrame에 순위 열을 추가합니다.
```
df.withColumn("rank", rank().over(w))
```
로그인 후 복사
유지하도록 DataFrame을 필터링합니다. 각각의 상위 N개 레코드 group:
```
df.where($"rank" <= n)
```
로그인 후 복사

행 번호를 사용한 대안

연결을 끊을 필요가 없으면 대신 row_number 함수를 사용할 수 있습니다. 순위 함수의 이렇게 하면 각 그룹의 각 레코드에 대해 고유한 행 번호가 제공됩니다.

df.withColumn("row_number", row_number().over(w))

로그인 후 복사

그런 다음 DataFrame을 필터링하여 이전과 동일한 기준을 사용하여 각 그룹의 상위 N개 레코드만 유지할 수 있습니다.

위 내용은 Spark DataFrame에서 각 그룹의 상위 N개 레코드를 얻는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이전 기사：MySQL 오류 1452를 해결하는 방법: 외래 키 제약 조건이 실패합니까? 다음 기사：MySQL 쿼리에서 누락된 날짜를 처리하는 방법은 무엇입니까?

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

몬스터 헌터 와일드 : 그레이트 칼 빌드 가이드

2025-03-13 18:04:21
몬스터 헌터 와일드 : 랜스 빌드 가이드

2025-03-13 18:03:24
Fragpunk의 스포트라이트는 PC에서 시작/충돌 문제를 시작하지 않습니다

2025-03-13 18:01:26
더 많은 회사 가이 멍청이를 만들기를 바랍니다

2025-03-13 13:32:14
AirPods Pro 2는 지금 $ 80 할인입니다

2025-03-13 13:31:09
Google Pixel March 업데이트가 화면 및 햅틱 문제를 일으키는 업데이트

2025-03-13 13:14:11
Crossover 25는 Linux & Mac에 더 많은 Windows 소프트웨어를 제공합니다.

2025-03-13 13:10:15
모든 후 처리 정크없이 Android에서 사진을 찍는 방법

2025-03-13 13:09:17
NYT 가닥 답변 및 힌트 -2025 년 3 월 13 일 솔루션 #375

2025-03-13 13:01:10
Longvinter : 캐릭터를 사용자 정의하는 방법

2025-03-13 12:59:09

최신 이슈

function_exists()는 사용자 정의 함수를 결정할 수 없습니다. 기능 테스트() { ...

에서 2024-04-29 11:01:01

0

3

2952

Chrome 모바일 버전을 표시하는 방법 안녕하세요 선생님, Chrome을 모바일 버전으로 어떻게 변경하나요?

에서 2024-04-23 00:22:19

0

11

3153

자식 창이 부모 창을 작동하지만 출력이 응답하지 않습니다. 처음 두 문장은 실행 가능하지만 마지막 문장은 구현할 수 없습니다.

에서 2024-04-19 15:37:47

0

1

2570

상위 창에 출력이 없습니다. document.onclick = function(){ window.opener.document.write('나는 자식 창의 출력입니다.');

에서 2024-04-18 23:52:34

0

1

2518

CSS 마인드맵 코스웨어는 어디에 있나요? 코스웨어

에서 2024-04-16 10:10:18

0

0

2551

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿