ビッグデータ時代の到来により、大規模なリアルタイムデータ処理方法の継続的な更新と改善が大きな注目と重要性を集めています。クラウド コンピューティングとコンテナ テクノロジーの継続的な開発により、Apache Flink は、ストリーミング データ (Spark と Storm 間のアルゴリズムなど) を迅速に処理し、バッチ処理のサポートも提供するリアルタイム コンピューティング エンジンになりました。
Flink は、無制限および制限付きのデータ ストリーム処理をサポートするイベント駆動型の処理エンジンです。ストリーム処理の速度とスループットの点で利点があるだけでなく、複雑なイベント分析、機械学習、グラフィックスの処理と分析などで広く使用されています。
この記事では、PHP 言語を使用して Flink リアルタイム コンピューティングを実装する方法を紹介します。
1. Flink のインストール
Flink を実行するには Java JDK 8 以降が必要です。インストールする前に、Java JDK がインストールされていることを確認してください。以下の Flink をインストールしましょう。
- Apache Flink バイナリ圧縮パッケージをダウンロードします。
Flink 公式 Web サイトにアクセスして Flink をダウンロードし、最新の Flink 1.14.0 バージョンを選択します。次のコマンドを使用してダウンロードすることもできます:
- インストール パッケージを解凍します
次のコマンドを使用して、ダウンロードした Flink インストール パッケージを解凍します:
1 | $ tar -xvzf flink-1.14.0-bin-scala_2.11.tgz
|
ログイン後にコピー
- Flink クラスターを開始します
##次のコマンドを使用して Flink クラスターを開始します:
1 2 | $ cd flink-1.14.0/bin/
$ ./start-cluster.sh
|
ログイン後にコピー
次のコマンドを使用して Flink クラスターが開始されているかどうかを確認します:
2. PHP は Flink リアルタイム コンピューティングを実装します
その前に、Flink がデータをどのように処理するかを理解する必要があります。 Flink は DataStream API を使用してデータ ストリームを処理します。ユーザーは DataStream API を使用して、データ ストリーム処理アプリケーションを構築できます。
以下では、PHP 言語を使用して Flink データ ストリーム処理アプリケーションを実装します。
PHP コードの作成
次のコードを使用して単純なデータ ストリームを生成します:
1 2 3 4 5 6 7 8 9 10 11 12 13 | require_once 'vendor/autoload.php' ;
use FlinkDataStream;
$env = new FlinkEnvironment();
$stream = $env ->fromCollection([
[1, 'apple' ],
[2, 'banana' ],
[3, 'cherry' ]
]);
$stream -> print ();
|
ログイン後にコピー
次のコマンドを使用して PHP コードを実行します:
出力結果は次のとおりです。
1 2 3 | 1, apple
2, banana
3, cherry
|
ログイン後にコピー
#Flink ジョブの作成
- Flink ジョブは、Flink の DataSource (データ ソース) と DataSink (データシンク)。
DataStream API では、DataSource は StreamExecutionEnvironment クラスのメソッドによって作成され、メモリ内のコレクション、ファイル システム、または Kafka などのデータ ソースからデータを取得できます。
次のコードを使用して、DataStream 内のデータをテキスト ファイルに書き込みます。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | require_once 'vendor/autoload.php' ;
use FlinkEnvironment;
use FlinkDataStreamStreamExecutionEnvironment;
$env = new Environment();
$stream = $env ->fromCollection([
[1, 'apple' ],
[2, 'banana' ],
[3, 'cherry' ]
]);
$stream ->writeAsCsv( '/path/to/file.csv' );
$env ->execute();
|
ログイン後にコピー
上記のコードを実行すると、指定したパスに file.csv という名前のファイルが生成されます。このファイルには DataStream のデータが書き込まれており、その内容は次のとおりです。
3. まとめ
この記事では、PHP 言語を使用して Flink リアルタイム コンピューティングを実装する方法を紹介します。 Flink をインストールし、PHP コードを使用して簡単なデータ フローを作成し、それをテキスト ファイルに書き込みました。 Flink は、リアルタイム データ ストリームの処理に使用できる強力なイベント処理エンジンと DataStream API を提供します。 Flink はリアルタイム コンピューティングの速度とスループットに利点があり、機械学習、グラフィックス処理、分析での使用が増えています。
以上がPHP はオープンソースの Flink リアルタイム コンピューティングを実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。