빅데이터 시대의 도래와 함께 대규모 실시간 데이터 처리 방식의 지속적인 업데이트와 개선이 많은 관심과 중요성을 불러일으키고 있습니다. 클라우드 컴퓨팅과 컨테이너 기술의 지속적인 발전으로 Apache Flink는 스트리밍 데이터(예: Spark와 Storm 간의 알고리즘)를 빠르게 처리하고 일괄 처리 지원도 제공하는 실시간 컴퓨팅 엔진으로 자리 잡았습니다.
Flink는 무제한 및 제한된 데이터 스트림 처리를 지원하는 이벤트 중심 처리 엔진입니다. 스트림 처리의 속도와 처리량 측면에서 장점이 있을 뿐만 아니라 복잡한 이벤트 분석, 기계 학습, 그래픽 처리 및 분석 등에 널리 사용되었습니다.
이 글에서는 PHP 언어를 사용하여 Flink 실시간 컴퓨팅을 구현하는 방법을 소개합니다.
1. Flink 설치
Flink를 실행하려면 Java JDK 8 이상이 필요합니다. 설치하기 전에 Java JDK가 설치되어 있는지 확인하십시오. 이제 Flink를 설치해 보겠습니다.
Flink 공식 웹사이트로 이동하여 Flink를 다운로드하고 최신 Flink 1.14.0 버전을 선택하세요. 다음 명령을 사용하여 다운로드할 수도 있습니다.
$ wget https://archive.apache.org/dist/flink/flink-1.14.0/flink-1.14.0-bin-scala_2.11.tgz
다음 명령을 사용하여 다운로드한 Flink 설치 패키지의 압축을 풉니다.
$ tar -xvzf flink-1.14.0-bin-scala_2.11.tgz
다음 명령을 사용하여 시작합니다. Flink 클러스터:
$ cd flink-1.14.0/bin/ $ ./start-cluster.sh
다음 명령을 사용하여 Flink 클러스터가 시작되었는지 확인하세요.
$ ./flink list
2. PHP는 Flink 실시간 계산을 구현합니다
이전에 Flink가 데이터를 처리하는 방법을 이해해야 합니다. Flink는 DataStream API를 사용하여 데이터 스트림을 처리합니다. 사용자는 DataStream API를 사용하여 데이터 스트림 처리 애플리케이션을 구축할 수 있습니다.
아래에서는 PHP 언어를 사용하여 Flink 데이터 스트림 처리 애플리케이션을 구현합니다.
다음 코드를 사용하여 간단한 데이터 흐름을 생성합니다.
require_once 'vendor/autoload.php'; use FlinkDataStream; $env = new FlinkEnvironment(); $stream = $env->fromCollection([ [1, 'apple'], [2, 'banana'], [3, 'cherry'] ]); $stream->print();
다음 명령을 사용하여 PHP 코드를 실행합니다.
$ php myDataStream.php
출력은 다음과 같습니다.
1, apple 2, banana 3, cherry
Flink 작업이 있습니다. Flink는 DataSource(데이터 소스)와 DataSink(데이터 싱크)로 구성됩니다.
DataStream API에서 DataSource는 메모리 내 컬렉션, 파일 시스템 또는 Kafka와 같은 데이터 소스에서 데이터를 가져올 수 있는 StreamExecutionEnvironment 클래스의 메서드로 생성됩니다.
다음 코드를 사용하여 DataStream의 데이터를 텍스트 파일에 씁니다.
require_once 'vendor/autoload.php'; use FlinkEnvironment; use FlinkDataStreamStreamExecutionEnvironment; $env = new Environment(); $stream = $env->fromCollection([ [1, 'apple'], [2, 'banana'], [3, 'cherry'] ]); $stream->writeAsCsv('/path/to/file.csv'); $env->execute();
위 코드를 실행하면 지정된 경로에 file.csv라는 파일이 생성되고 DataStream 데이터가 텍스트 파일에 기록됩니다.
1,apple 2,banana 3,cherry
3. 결론
이 글에서는 PHP 언어를 사용하여 Flink 실시간 컴퓨팅을 구현하는 방법을 소개합니다. 우리는 Flink를 설치하고 PHP 코드를 사용하여 간단한 데이터 흐름을 작성하고 이를 텍스트 파일에 썼습니다. Flink는 실시간 데이터 스트림을 처리하는 데 사용할 수 있는 강력한 이벤트 처리 엔진과 DataStream API를 제공합니다. Flink는 실시간 컴퓨팅의 속도와 처리량 측면에서 장점이 있으며 기계 학습, 그래픽 처리 및 분석에 점점 더 많이 사용되고 있습니다.
위 내용은 PHP는 오픈 소스 Flink 실시간 컴퓨팅을 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!