MySQL テーブルを Spark DataFrame として読み取る方法は?-mysql チュートリアル-php.cn

MySQL テーブルを Spark DataFrame として読み取る方法は?

Patricia Arquette

リリース： 2024-11-01 02:08:02

オリジナル

291 人が閲覧しました

How to Read MySQL Tables as Spark DataFrames?

データベーステーブルの読み取りのための Apache Spark と MySQL の統合

Apache Spark を MySQL に接続し、データベーステーブルを Spark データフレームとして利用するには、次の手順に従います。 :

Spark セッションを作成します:

1
2
3
4
5
6
<code class="python">from pyspark.sql import SparkSession

# Create a Spark session object
spark = SparkSession.builder \
.appName("Spark-MySQL-Integration") \
.getOrCreate()</code>
ログイン後にコピー
MySQL コネクタをインスタンス化します:

1
2
3
4
<code class="python">from pyspark.sql import DataFrameReader

# Create a DataFrameReader object for MySQL connection
jdbc_df_reader = DataFrameReader(spark)</code>
ログイン後にコピー

MySQL 接続パラメータの構成:

<code class="python"># Set MySQL connection parameters
jdbc_params = {
    "url": "jdbc:mysql://localhost:3306/my_db",
    "driver": "com.mysql.jdbc.Driver",
    "dbtable": "my_table",
    "user": "root",
    "password": "password"
}</code>

ログイン後にコピー

データベーステーブルの読み取り :

<code class="python"># Read the MySQL table as a Spark dataframe
dataframe_mysql = jdbc_df_reader.format("jdbc") \
    .options(**jdbc_params) \
    .load()
 
# Print the dataframe schema
dataframe_mysql.printSchema()</code>