如何將 MySQL 表讀取為 Spark DataFrame?

Patricia Arquette
發布: 2024-11-01 02:08:02
原創
185 人瀏覽過

How to Read MySQL Tables as Spark DataFrames?

將Apache Spark 與MySQL 整合以讀取資料庫表

要將Apache Spark 與MySQL 連線並將資料庫表用作Spark 資料幀,請依照以下步驟操作:

  1. 建立Spark 會話:

    <code class="python">from pyspark.sql import SparkSession
    
    # Create a Spark session object
    spark = SparkSession.builder \
        .appName("Spark-MySQL-Integration") \
        .getOrCreate()</code>
    登入後複製
  2. 實例化MySQL Connector

    :
    <code class="python">from pyspark.sql import DataFrameReader
    
    # Create a DataFrameReader object for MySQL connection
    jdbc_df_reader = DataFrameReader(spark)</code>
    登入後複製
  3. 配置MySQL 連接參數

    :
    <code class="python"># Set MySQL connection parameters
    jdbc_params = {
        "url": "jdbc:mysql://localhost:3306/my_db",
        "driver": "com.mysql.jdbc.Driver",
        "dbtable": "my_table",
        "user": "root",
        "password": "password"
    }</code>
    登入後複製
  4. 讀取資料庫表

    :
    <code class="python"># Read the MySQL table as a Spark dataframe
    dataframe_mysql = jdbc_df_reader.format("jdbc") \
        .options(**jdbc_params) \
        .load()
    
    # Print the dataframe schema
    dataframe_mysql.printSchema()</code>
    登入後複製

此方法演示瞭如何將Apache Spark 與MySQL 集成,允許您將資料庫表作為Spark 資料幀存取。

以上是如何將 MySQL 表讀取為 Spark DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板