介绍一下什么是Apache Flink-Apache-PHP中文网

首页

运维

Apache

介绍一下什么是Apache Flink

王林

Oct 20, 2020 pm 05:10 PM

apache flink

介绍一下什么是Apache Flink

Apache Flink介绍：

Apache Flink 是一个框架和分布式处理引擎，用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行，并能以内存速度和任意规模进行计算。

（推荐教程：apache）

接下来，我们来介绍一下 Flink 架构中的重要方面。

处理无界和有界数据

任何类型的数据都可以形成一种事件流。信用卡交易、传感器测量、机器日志、网站或移动应用程序上的用户交互记录，所有这些数据都形成一种流。

数据可以被作为无界或者有界流来处理。

1.无界流有定义流的开始，但没有定义流的结束。它们会无休止地产生数据。无界流的数据必须持续处理，即数据被摄取后需要立刻处理。我们不能等到所有数据都到达再处理，因为输入是无限的，在任何时候输入都不会完成。处理无界数据通常要求以特定顺序摄取事件，例如事件发生的顺序，以便能够推断结果的完整性。

2.有界流有定义流的开始，也有定义流的结束。有界流可以在摄取所有数据后再进行计算。有界流所有数据可以被排序，所以并不需要有序摄取。有界流处理通常被称为批处理。

Apache Flink 擅长处理无界和有界数据集精确的时间控制和状态化使得 Flink 的运行时(runtime)能够运行任何处理无界流的应用。有界流则由一些专为固定大小数据集特殊设计的算法和数据结构进行内部处理，产生了出色的性能。

通过探索 Flink 之上构建的用例来加深理解。

部署应用到任意地方

Apache Flink 是一个分布式系统，它需要计算资源来执行应用程序。Flink 集成了所有常见的集群资源管理器，例如 Hadoop YARN、 Apache Mesos 和 Kubernetes，但同时也可以作为独立集群运行。

Flink 被设计为能够很好地工作在上述每个资源管理器中，这是通过资源管理器特定(resource-manager-specific)的部署模式实现的。Flink 可以采用与当前资源管理器相适应的方式进行交互。

部署 Flink 应用程序时，Flink 会根据应用程序配置的并行性自动标识所需的资源，并从资源管理器请求这些资源。在发生故障的情况下，Flink 通过请求新资源来替换发生故障的容器。提交或控制应用程序的所有通信都是通过 REST 调用进行的，这可以简化 Flink 与各种环境中的集成。

运行任意规模应用

Flink 旨在任意规模上运行有状态流式应用。因此，应用程序被并行化为可能数千个任务，这些任务分布在集群中并发执行。所以应用程序能够充分利用无尽的 CPU、内存、磁盘和网络 IO。而且 Flink 很容易维护非常大的应用程序状态。其异步和增量的检查点算法对处理延迟产生最小的影响，同时保证精确一次状态的一致性。

Flink 用户报告了其生产环境中一些令人印象深刻的扩展性数字

处理每天处理数万亿的事件,应用维护几TB大小的状态, 和应用在数千个内核上运行。

利用内存性能

有状态的 Flink 程序针对本地状态访问进行了优化。任务的状态始终保留在内存中，如果状态大小超过可用内存，则会保存在能高效访问的磁盘数据结构中。任务通过访问本地（通常在内存中）状态来进行所有的计算，从而产生非常低的处理延迟。Flink 通过定期和异步地对本地状态进行持久化存储来保证故障场景下精确一次的状态一致性。

以上是介绍一下什么是Apache Flink的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7552

CakePHP 教程

1382

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

Apache故障排除：诊断和解决常见错误 Apr 03, 2025 am 12:07 AM

Apache错误可以通过查看日志文件来诊断和解决。1)查看error.log文件，2)使用grep命令过滤特定域名的错误，3)定期清理日志文件并优化配置，4)使用监控工具实时监控和告警。通过这些步骤，可以有效地诊断和解决Apache错误。

Apache性能调整：优化速度和效率 Apr 04, 2025 am 12:11 AM

提升Apache性能的方法包括：1.调整KeepAlive设置，2.优化多进程/线程参数，3.使用mod_deflate进行压缩，4.实施缓存和负载均衡，5.优化日志记录。通过这些策略，可以显着提高Apache服务器的响应速度和并发处理能力。

apache中cgi目录怎么设置 Apr 13, 2025 pm 01:18 PM

要在 Apache 中设置 CGI 目录，需要执行以下步骤：创建 CGI 目录，如 "cgi-bin"，并授予 Apache 写入权限。在 Apache 配置文件中添加 "ScriptAlias" 指令块，将 CGI 目录映射到 "/cgi-bin" URL。重启 Apache。

apache怎么启动 Apr 13, 2025 pm 01:06 PM

启动 Apache 的步骤如下：安装 Apache（命令：sudo apt-get install apache2 或从官网下载）启动 Apache（Linux：sudo systemctl start apache2；Windows：右键“Apache2.4”服务并选择“启动”）检查是否已启动（Linux：sudo systemctl status apache2；Windows：查看服务管理器中“Apache2.4”服务的状态）启用开机自动启动（可选，Linux：sudo systemctl

Apache模块掌握：使用mod_rewrite及更多功能扩展功能 Apr 05, 2025 am 12:02 AM

Apache服务器可以通过mod_rewrite模块扩展功能，提升性能和安全性。1.开启重写引擎并定义规则，如将/blog重定向到/articles。2.使用条件判断进行特定参数的重写。3.实现基本和高级URL重写，如.html到.php的转换和移动设备检测。4.通过日志调试常见错误。5.优化性能，减少规则数量，优化顺序，使用条件判断，并编写清晰的规则。