Rumah > pangkalan data > tutorial mysql > Bagaimanakah Saya Boleh Mengambil Keputusan Pertanyaan Khusus daripada Pangkalan Data Luaran Menggunakan JDBC PySpark?

Bagaimanakah Saya Boleh Mengambil Keputusan Pertanyaan Khusus daripada Pangkalan Data Luaran Menggunakan JDBC PySpark?

Linda Hamilton
Lepaskan: 2024-11-30 07:34:15
asal
445 orang telah melayarinya

How Can I Fetch Specific Query Results from an External Database Using PySpark's JDBC?

Mengambil Keputusan Pertanyaan Khusus daripada Pangkalan Data Luaran dalam Apache Spark 2.0.0

Apabila bekerja dengan pangkalan data luaran dalam Apache Spark 2.0.0 menggunakan PySpark , pengguna mungkin mahu mengambil data daripada pertanyaan tertentu dan bukannya mengambil keseluruhan jadual. Ini boleh meningkatkan prestasi dan mengurangkan pemindahan data.

Soalan:

Dalam kod PySpark berikut, df DataFrame dimuatkan daripada jadual pangkalan data bernama "schema.tablename" . Bagaimanakah kita boleh mengubah suai kod untuk mengambil data daripada set hasil pertanyaan tersuai?

from pyspark.sql import SparkSession

spark = SparkSession\
    .builder\
    .appName("spark play")\
    .getOrCreate()    

df = spark.read\
    .format("jdbc")\
    .option("url", "jdbc:mysql://localhost:port")\
    .option("dbtable", "schema.tablename")\
    .option("user", "username")\
    .option("password", "password")\
    .load()
Salin selepas log masuk

Jawapan:

Untuk mengambil set keputusan tersuai pertanyaan, sediakan pertanyaan sebagai hujah "dbtable" dalam pilihan Spark DataFrameReader. Pertanyaan mesti disertakan dalam kurungan dan dialiaskan kepada nama jadual sementara.

...
.option("dbtable", "(SELECT foo, bar FROM schema.tablename) AS tmp")
...
Salin selepas log masuk

Dengan menghantar subquery sebagai argumen "dbtable", Spark akan melaksanakan pertanyaan dan memuatkan data yang terhasil ke dalam DataFrame. Ini membolehkan pengguna mendapatkan semula data tertentu daripada pangkalan data luaran tanpa overhed untuk mengambil keseluruhan jadual.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengambil Keputusan Pertanyaan Khusus daripada Pangkalan Data Luaran Menggunakan JDBC PySpark?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan