从0到1学会 Flink

2024-11-10 上传 204 页 18.1 MB 1 阅读
本文主要介绍 Flink Runtime 的作业执行的核心机制。首先介绍 Flink Runtime 的整体架构以及 Job 的基本执行流程,然后介绍在这个过程,Flink 是怎么进行资源管理、作业调度以及错误恢复的。最后,还将简要介绍 Flink Runtime 层当前正在进行的一些工作。
Flink是一款分布式的计算引擎,它可以用来做批处理,即处理静态的数据集、历史的数据集;也可以用来做流处理,即实时地处理一些实时数据流,实时地产生数据的结果;也可以用来做一些基于事件的应用,比如说滴滴通过Flink CEP实现实时监测用户及司机的行为流来判断用户或司机的行为是否正当。 总而言之,Flink是一个Stateful Computations Over Streams,即数据流上的有状态的计算。这里面有两个关键字,一个是Streams,Flink认为有界数据集是无界数据流的一种特例,所以说有界数据集也是一种数据流,事件流也是一种数据流。Everything is streams,即Flink可以用来处理任何的数据,可以支持批处理、流处理、AI、MachineLearning等等。
1 / 204
2 / 204
3 / 204
4 / 204
5 / 204
标签:Flink
温馨提示:
1.未经权益所有人同意不得将文件中的内容挪作商业或盈利用途;
2.本站仅提供存储空间,仅对用户上传内容作预览展示处理,对用户上传分享的文档内容本身不做任何修改或编辑,本站不对任何下载内容负责;
3.下载文件中如有侵权或不当内容,请与我们联系,我们立即纠正;
4.本站不保证下载资源的准确性、安全性和完整性,同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的损失。
最新评论
请遵守国家互联网相关法律、法规,文明评论。
相关文章
Java大数据之Flink

Apache Flink是一个开源的分布式,高性能,高可用,准确的流处理框架。支持实时流处理和批处理。


规则引擎深度对比,LiteFlow vs Drools!

这篇文章深入对比了 LiteFlow 和 Drools 两款 Java 规则引擎框架。介绍了规则引擎的定义,从规则表达式、和 Java 数据交换、API 及集成、侵入性耦合、学习成本、语言插件、规则存储、热更新、界面形态、性能表现等方面进行比较。


SpringBoot 实现热插拔 AOP

本文实现热插拔AOP就在于对advice、advised、advisor、pointcut概念的理解,这是实现热插拔AOP的前提,其次就是对自定义classloader也需要有一定的了解。


Lucene的Smart CN实现分词、停用词、扩展词

Lucene 中提供了 SmartCN 为中文提供分词功能,实际应用中还会涉及到停用词、扩展词(特殊词、专业词)等,因此本文将聚焦在 SmartCN 而暂时不考虑其他中文分词类库。


剖析Spark集群技术在美团网站的实战运用

这篇文章主要介绍了Spark集群技术在美团网站的实战运用,Spark在数据挖掘、特别是用户行为分析方面为美团点评带来巨大推动,需要的朋友可以参考下