1. hudi overview

    一个spark库,大数据更新解决方案,分别对读和写进行了优化

    2021/04/19 hudi

  2. Executor框架与线程池

    介绍Executor框架的整体结构,主要分析了线程池的工作原理

    2021/01/12 Java

  3. AQS与Lock原理解析

    队列同步器AbstractQueuedSynchronizer,是用来构建锁或者其他同步组件的基础框架,在其基础上实现了Reentrantlock, ReentrantReadWriteLock, CountDownLatch等。

    2021/01/11 Java

  4. 线程安全的单例模式

    许多时候整个系统只需要拥有一个的全局对象,这样有利于协调系统整体的行为。

    2021/01/10 Java

  5. 大数据日知录学习(八):HBase与BigTable

    BigTable是一种针对海量结构化数据的分布式列式存储的数据库。HBase是参考BigTable论文的开源实现。

    2020/12/14 大数据理论与架构

  6. 大数据日知录学习(七):Kafka

    分布式系统构件之间通过传递消息可以解除相互之间的功能耦合,这样可以减轻子系统之间的依赖,使得各个子系统或者构件可以独立演进、维护或者重用。消息队列是在消息传输过程中保存消息的容器或中间件、其主要目的是提供消息路由并保障消息可靠传递。

    2020/12/13 大数据理论与架构

  7. Flink: 故障恢复

    Flink中精准一次的容错机制

    2020/12/07 Flink

  8. Flink: 状态

    Flink中高效而丰富的算子状态管理机制

    2020/12/07 Flink

  9. Flink: Window、Time、Watermark

    Flink通过Window、Time、Watermark完成乱序事件处理,定义窗口以及维护和更新用户定义状态等

    2020/12/07 Flink

  10. Flink: 数据流

    Flink中的有界流对应着Dataset为批处理和无界流对应着DataStream为流处理

    2020/12/07 Flink