Flink介绍/概览(摘自Stream Processing With Apache Flink）

最近工作上用到flink，需要对flink学习和研究<Stream Processing With Apache Flink>

第一代：lamda

第二代2013：提供了---运行一次（exactly once）保证

Flink就是第三代流处理器的一中

加入了：事件时间（event time）和处理时间（processing time）语义，event-time语义提供精确性和一致性结果（即使是乱序事件）；Processing time 用来延迟要求非常低的场景
仅一次（Exactly once）保证
百万/千万数据，毫秒级别延迟
提供分层的API。如DataStream API和Processing functions（windows函数，异步操做和精确时间和状态函数），关系API,linq式的table api
连接器（Connectors）---涵盖大部分存储系统---kafka，es，jdbc，hdfs，s3等
没有单点失败：高可用，7*24小时，非常低的downtime，紧密集成yarn，k8s,mesos，可以快速从失败恢复，动态扩展job的运行环境
可以更改job的code，或者迁移job到不同的集群，而不丢失状态
详细，且可以自定义系统运行指标metrics，提前发现问题
flink也可以是一个完整功能的离线处理引擎
开发人员友好，可以用ide调试（可以把flink所有模块运行到一个jvm里面）

、

百谷博客