Bagaimana untuk Menambah Lajur Malar pada Spark DataFrame?

Linda Hamilton
Lepaskan: 2024-11-07 00:31:02
asal
383 orang telah melayarinya

How to Add a Constant Column to a Spark DataFrame?

Mencipta Lajur Malar dalam Spark DataFrame

Menambah lajur malar pada Spark DataFrame dengan nilai arbitrari yang digunakan pada semua baris boleh dicapai dalam beberapa cara. Kaedah withColumn, bertujuan untuk tujuan ini, boleh membawa kepada ralat apabila cuba memberikan nilai langsung sebagai hujah kedua.

Menggunakan Nilai Tersurat (Spark 1.3 )

Untuk menyelesaikan isu ini, gunakan lit untuk mencipta perwakilan literal bagi nilai yang dikehendaki:

from pyspark.sql.functions import lit

df.withColumn('new_column', lit(10))
Salin selepas log masuk

Mencipta Lajur Kompleks (Spark 1.4 )

Untuk jenis lajur yang lebih kompleks , seperti tatasusunan, struct atau peta, gunakan fungsi yang sesuai:

from pyspark.sql.functions import array, struct

df.withColumn('array_column', array(lit(1), lit(2)))
df.withColumn('struct_column', struct(lit('foo'), lit(1)))
Salin selepas log masuk

Typed Literals (Spark 2.2 )

Spark 2.2 memperkenalkan typedLit, menyediakan sokongan untuk Seq, Map dan Tuples:

import org.apache.spark.sql.functions.typedLit

df.withColumn("some_array", typedLit(Seq(1, 2, 3)))
Salin selepas log masuk

Menggunakan Fungsi Ditentukan Pengguna (UDF)

Sebagai alternatif, buat UDF yang mengembalikan nilai malar:

from pyspark.sql import functions as F

def constant_column(value):
    def udf(df):
        return [value for _ in range(df.count())]
    return F.udf(udf)

df.withColumn('constant_column', constant_column(10))
Salin selepas log masuk

Nota:

Kaedah ini juga boleh digunakan untuk menyampaikan hujah berterusan kepada UDF atau fungsi SQL.

Atas ialah kandungan terperinci Bagaimana untuk Menambah Lajur Malar pada Spark DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!