1. hudi overview

  一个spark库,大数据更新解决方案,分别对读和写进行了优化

  2021/04/19 hudi

 2. Executor框架与线程池

  介绍Executor框架的整体结构,主要分析了线程池的工作原理

  2021/01/12 Java

 3. AQS与Lock原理解析

  队列同步器AbstractQueuedSynchronizer,是用来构建锁或者其他同步组件的基础框架,在其基础上实现了Reentrantlock, ReentrantReadWriteLock, CountDownLatch等。

  2021/01/11 Java

 4. 线程安全的单例模式

  许多时候整个系统只需要拥有一个的全局对象,这样有利于协调系统整体的行为。

  2021/01/10 Java

 5. 大数据日知录学习(八):HBase与BigTable

  BigTable是一种针对海量结构化数据的分布式列式存储的数据库。HBase是参考BigTable论文的开源实现。

  2020/12/14 大数据理论与架构

 6. 大数据日知录学习(七):Kafka

  分布式系统构件之间通过传递消息可以解除相互之间的功能耦合,这样可以减轻子系统之间的依赖,使得各个子系统或者构件可以独立演进、维护或者重用。消息队列是在消息传输过程中保存消息的容器或中间件、其主要目的是提供消息路由并保障消息可靠传递。

  2020/12/13 大数据理论与架构

 7. Flink: 故障恢复

  Flink中精准一次的容错机制

  2020/12/07 Flink

 8. Flink: 状态

  Flink中高效而丰富的算子状态管理机制

  2020/12/07 Flink

 9. Flink: Window、Time、Watermark

  Flink通过Window、Time、Watermark完成乱序事件处理,定义窗口以及维护和更新用户定义状态等

  2020/12/07 Flink

 10. Flink: 数据流

  Flink中的有界流对应着Dataset为批处理和无界流对应着DataStream为流处理

  2020/12/07 Flink