Spark データフレームでネストされた構造体をフラット化するにはどうすればよいですか?

Patricia Arquette
リリース: 2024-10-25 09:51:02
オリジナル
723 人が閲覧しました

How to Flatten Nested Structs in a Spark Dataframe?

Spark データフレームのネストされた構造体のフラット化

データフレームに複雑なネストされた構造が含まれており、それらのフラット化が必要になる場合があります。次の構造を持つデータフレームを考えます:

|-- data: struct (nullable = true)
|    |-- id: long (nullable = true)
|    |-- keyNote: struct (nullable = true)
|    |    |-- key: string (nullable = true)
|    |    |-- note: string (nullable = true)
|    |-- details: map (nullable = true)
|    |    |-- key: string
|    |    |-- value: string (valueContainsNull = true)
ログイン後にコピー

目標は、この構造を平坦化し、次の単純化された構造を持つ新しいデータフレームを作成することです:

|-- id: long (nullable = true)
|-- keyNote: struct (nullable = true)
|    |-- key: string (nullable = true)
|    |-- note: string (nullable = true)
|-- details: map (nullable = true)
|    |-- key: string
|    |-- value: string (valueContainsNull = true)
ログイン後にコピー

Spark は明示的に提供しません。構造体の「explode」関数の場合、Spark 1.6 以降では次のメソッドを使用して目的の結果を達成できます:

df.select(df.col("data.*"))
ログイン後にコピー

あるいは、「data」構造体の特定のフィールドのみが必要な場合は、次の構文を使用できます:

df.select(df.col("data.id"), df.col("data.keyNote"), df.col("data.details"))
ログイン後にコピー

これらの手法を利用すると、Spark データフレーム内の複雑なネストされた構造体を平坦化し、データのさらなる分析と操作が可能になります。

以上がSpark データフレームでネストされた構造体をフラット化するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!