コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > データベース > mysql チュートリアル > Spark RDD で SQL の「ROW_NUMBER()」関数をシミュレートする方法

Spark RDD で SQL の「ROW_NUMBER()」関数をシミュレートする方法

DDD

リリース： 2024-12-22 09:41:57

オリジナル

739 人が閲覧しました

How to Simulate SQL's `ROW_NUMBER()` Function in Spark RDD?

Spark RDD で同等の SQL 行番号

Spark では、SQL の row_number() に相当する行番号を取得します (.. RDD の .order by ...) は、Spark 1.4 の拡張機能を使用して実現できます。

解決策:

テスト RDD の作成:

val sample_data = Seq(((3, 4), 5, 5, 5),
((3, 4), 5, 5, 9),
((3, 4), 7, 5, 5),
((1, 2), 1, 2, 3),
((1, 2), 1, 4, 7),
((1, 2), 2, 2, 3))

val temp1 = sc.parallelize(sample_data)

ログイン後にコピー

キーによるパーティション分割と順序:

Spark 1.4 で導入された rowNumber() 関数を使用して、パーティション分割されたウィンドウを作成します:

import org.apache.spark.sql.expressions.Window

val partitionedRdd = temp1
  .map(x => (x._1, x._2._1, x._2._2, x._2._3))
  .groupBy(_._1)
  .mapGroups((_, entries) =>
    entries.toList
      .sortBy(x => (x._2, -x._3, x._4))
      .zipWithIndex
      .map(x => (x._1._1, x._1._2, x._1._3, x._1._4, x._2 + 1))
  )

ログイン後にコピー

結果の出力:

partitionedRdd.foreach(println)

// Example output:
// ((1,2),1,4,7,1)
// ((1,2),1,2,3,2)
// ((1,2),2,2,3,3)
// ((3,4),5,5,5,4)
// ((3,4),5,5,9,5)
// ((3,4),7,5,5,6)

ログイン後にコピー

以上がSpark RDD で SQL の「ROW_NUMBER()」関数をシミュレートする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

前の記事：JDBC を使用して Unicode テキストを MySQL に挿入するときに発生する「文字列値が正しくありません」エラーを修正する方法次の記事：データベースから N 番目の最高給与を効率的に見つけるにはどうすればよいですか?

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

スナイパーエリート：抵抗 - 弾薬の入手方法

2025-02-08 10:04:13
シムズ2：ビジネスを購入して運営する方法

2025-02-08 08:05:41
Roblox：それを掘る - 速くレベルアップする方法

2025-02-08 06:04:07
魔法：The Gathering -Eternal Might Commander Deck Guide

2025-02-08 06:03:08
エンダーMagnolia：霧の中で咲く - ダイビング能力を得る方法

2025-02-08 04:04:10
独占GO：Tycoon Racers Rewards Guide（2月6〜10日）

2025-02-08 04:02:14
フィッシュでクラーケンを捕まえる方法

2025-02-08 02:10:08
鉄の尾2：冬のひげ - アイスブレーカービーストハントウォークスルー

2025-02-08 02:09:09
シムズ：機械的スキルの構築方法

2025-02-08 02:08:09
フィッシュで沈んだ深さのパズルを完成させる方法

2025-02-08 02:07:09

最新の問題

function_exists() はカスタム関数を決定できません Function test () {return true;} if (function_exists ('test')) {echo "テストは関数です";

から 2024-04-29 11:01:01

0

3

2686

Google Chromeのモバイル版を表示する方法こんにちは、先生、Google Chrome をモバイル版に変更するにはどうすればよいですか?

から 2024-04-23 00:22:19

0

11

2819

子ウィンドウは親ウィンドウを操作しますが、出力は応答しません。最初の 2 つの文は実行可能ですが、最後の文は実装できません。

から 2024-04-19 15:37:47

0

1

2379

親ウィンドウには出力がありません document.onclick = function(){ window.opener.document.write('私は子ウィンドウの出力です');

から 2024-04-18 23:52:34

0

1

2247

CSS マインドマッピングに関するコースウェアはどこにありますか? コースウェア

から 2024-04-16 10:10:18

0

0

2342

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート