ビッグデータ時代の到来により、大規模なリアルタイムデータ処理方法の継続的な更新と改善が大きな注目と重要性を集めています。クラウド コンピューティングとコンテナ テクノロジーの継続的な開発により、Apache Flink は、ストリーミング データ (Spark と Storm 間のアルゴリズムなど) を迅速に処理し、バッチ処理のサポートも提供するリアルタイム コンピューティング エンジンになりました。
Flink は、無制限および制限付きのデータ ストリーム処理をサポートするイベント駆動型の処理エンジンです。ストリーム処理の速度とスループットの点で利点があるだけでなく、複雑なイベント分析、機械学習、グラフィックスの処理と分析などで広く使用されています。
この記事では、PHP 言語を使用して Flink リアルタイム コンピューティングを実装する方法を紹介します。
1. Flink のインストール
Flink を実行するには Java JDK 8 以降が必要です。インストールする前に、Java JDK がインストールされていることを確認してください。以下の Flink をインストールしましょう。
Flink 公式 Web サイトにアクセスして Flink をダウンロードし、最新の Flink 1.14.0 バージョンを選択します。次のコマンドを使用してダウンロードすることもできます:
$ wget https://archive.apache.org/dist/flink/flink-1.14.0/flink-1.14.0-bin-scala_2.11.tgz
次のコマンドを使用して、ダウンロードした Flink インストール パッケージを解凍します:
$ tar -xvzf flink-1.14.0-bin-scala_2.11.tgz
$ cd flink-1.14.0/bin/ $ ./start-cluster.sh
次のコマンドを使用して Flink クラスターが開始されているかどうかを確認します:
$ ./flink list
2. PHP は Flink リアルタイム コンピューティングを実装します
その前に、Flink がデータをどのように処理するかを理解する必要があります。 Flink は DataStream API を使用してデータ ストリームを処理します。ユーザーは DataStream API を使用して、データ ストリーム処理アプリケーションを構築できます。
以下では、PHP 言語を使用して Flink データ ストリーム処理アプリケーションを実装します。
PHP コードの作成require_once 'vendor/autoload.php'; use FlinkDataStream; $env = new FlinkEnvironment(); $stream = $env->fromCollection([ [1, 'apple'], [2, 'banana'], [3, 'cherry'] ]); $stream->print();
次のコマンドを使用して PHP コードを実行します:
$ php myDataStream.php
出力結果は次のとおりです。
1, apple 2, banana 3, cherry
#Flink ジョブの作成
require_once 'vendor/autoload.php'; use FlinkEnvironment; use FlinkDataStreamStreamExecutionEnvironment; $env = new Environment(); $stream = $env->fromCollection([ [1, 'apple'], [2, 'banana'], [3, 'cherry'] ]); $stream->writeAsCsv('/path/to/file.csv'); $env->execute();
1,apple 2,banana 3,cherry
以上がPHP はオープンソースの Flink リアルタイム コンピューティングを実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。