Dengan kemunculan era data besar, pengemaskinian berterusan dan penambahbaikan kaedah pemprosesan data masa nyata berskala besar telah menarik perhatian dan kepentingan. Dengan pembangunan berterusan pengkomputeran awan dan teknologi kontena, Apache Flink telah menjadi enjin pengkomputeran masa nyata yang memproses data penstriman dengan pantas (seperti algoritma antara Spark dan Storm) dan juga menyediakan sokongan pemprosesan kelompok.
Flink ialah enjin pemprosesan dipacu peristiwa yang menyokong pemprosesan strim data tidak terhad dan terhad. Ia bukan sahaja mempunyai kelebihan dalam kelajuan dan pemprosesan strim, tetapi juga telah digunakan secara meluas dalam analisis peristiwa kompleks, pembelajaran mesin, pemprosesan dan analisis grafik, dsb.
Artikel ini akan memperkenalkan cara menggunakan bahasa PHP untuk melaksanakan pengkomputeran masa nyata Flink.
1. Pasang Flink
Flink memerlukan Java JDK 8 atau lebih tinggi untuk dijalankan. Sebelum memasang, pastikan anda telah memasang Java JDK. Seterusnya kami memasang Flink:
Pergi ke tapak web rasmi Flink untuk memuat turun Flink dan pilih versi Flink 1.14.0 terkini. Anda juga boleh menggunakan arahan berikut untuk memuat turun:
$ wget https://archive.apache.org/dist/flink/flink-1.14.0/flink-1.14.0-bin-scala_2.11.tgz
Gunakan arahan berikut untuk menyahmampat pakej pemasangan Flink yang dimuat turun:
$ tar -xvzf flink-1.14.0-bin-scala_2.11.tgz
Gunakan arahan berikut untuk memulakan gugusan Flink:
$ cd flink-1.14.0/bin/ $ ./start-cluster.sh
Gunakan arahan berikut untuk menyemak sama ada gugusan Flink dimulakan:
$ ./flink list
2. PHP melaksanakan pengkomputeran masa nyata Flink
Sebelum ini, anda perlu memahami cara Flink memproses data. Flink menggunakan API DataStream untuk mengendalikan aliran data. Pengguna boleh menggunakan API DataStream untuk membina aplikasi pemprosesan aliran data.
Di bawah ini kami akan menggunakan bahasa PHP untuk melaksanakan aplikasi pemprosesan aliran data Flink.
Jana aliran data ringkas menggunakan kod berikut:
require_once 'vendor/autoload.php'; use FlinkDataStream; $env = new FlinkEnvironment(); $stream = $env->fromCollection([ [1, 'apple'], [2, 'banana'], [3, 'cherry'] ]); $stream->print();
Laksanakan kod PHP menggunakan arahan berikut:
$ php myDataStream.php
Keputusan output adalah seperti berikut:
1, apple 2, banana 3, cherry
Kerja Flink terdiri daripada Sumber Data Flink (sumber data) dan DataSink (sinki data) .
Dalam API DataStream, DataSource dicipta melalui kaedah kelas StreamExecutionEnvironment dan boleh mendapatkan data daripada koleksi dalam memori, sistem fail atau sumber data seperti Kafka.
Gunakan kod berikut untuk menulis data dalam DataStream ke fail teks:
require_once 'vendor/autoload.php'; use FlinkEnvironment; use FlinkDataStreamStreamExecutionEnvironment; $env = new Environment(); $stream = $env->fromCollection([ [1, 'apple'], [2, 'banana'], [3, 'cherry'] ]); $stream->writeAsCsv('/path/to/file.csv'); $env->execute();
Selepas melaksanakan kod di atas, fail bernama file.csv akan dijana di bawah laluan yang ditentukan dan Data DataStream ditulis ke dalam fail ini, dan kandungannya adalah seperti berikut:
1,apple 2,banana 3,cherry
3. Kesimpulan
Artikel ini memperkenalkan cara menggunakan bahasa PHP untuk melaksanakan pengkomputeran masa nyata Flink. Kami memasang Flink, menulis aliran data ringkas menggunakan kod PHP, dan menulisnya ke fail teks. Flink menyediakan Enjin Pemprosesan Acara dan API DataStream yang berkuasa yang boleh digunakan untuk memproses aliran data masa nyata. Flink mempunyai kelebihan dalam kelajuan dan daya pemprosesan pengkomputeran masa nyata, dan semakin banyak digunakan dalam pembelajaran mesin, pemprosesan grafik dan analisis.
Atas ialah kandungan terperinci PHP melaksanakan pengkomputeran masa nyata Flink sumber terbuka. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!