1. Spark源码阅读(一):事件总线

    Spark中的事件总线用于接受事件并提交到对应的监听器中。

    2020/07/22 Spark

  2. 赚钱的思维 ——读《富爸爸穷爸爸》

    从未遇见一位没亏过钱的富人,却遇见过许多从未亏掉一毛钱的穷人。

    2020/07/14 BookReview

  3. Java8中的函数式编程和流式编程

    Java8的新特性,函数式编程和流式操作与Scala很相似。

    2020/07/13 Java

  4. Scala-模式匹配

    Scala中的模式匹配功能很强大,它是Java中的switch语句的升级版,同样可以用于替代一系列的 if/else 语句

    2020/06/19 Scala

  5. Spark作业gc时间过长

    在运行spark作业时,发现GC时间非常长,基本上快占task time 的三分之一了,最后通过GC日志确定了问题所在。

    2020/05/19 Spark

  6. 在spark-submit中自定义日志配置

    日志有助于debug和优化程序,对于spark程序而言,有时需要改变默认的日志配置,如调整日志输出级别,根据日志级别进行分流存储等

    2020/05/14 Spark

  7. Flink: 基本概念与架构

    Flink是一个分布式处理流式或者批量数据的系统,适用于多种数据处理应用,如实时分析,历史数据处理,迭代算法等,将它们转化为拥有流水机制和容错机制的数据流进行处理。

    2020/04/21 Flink

  8. 上帝已死,邪恶的时代 ——读《未来简史》

    对书中的内容感触颇深,记录一些自己荒诞的感悟。未来,可能正如进化论对于教徒,这是一个我不想去接受的时代。

    2020/04/18 BookReview

  9. 深入理解Java String

    解释Java String的不可变性以及字符串常量池。

    2020/03/12 Java

  10. Hive原理解析

    Hive是一个建立在Hapoop集群之上的数据仓库,依赖于HDFS的数据存储,依赖于MapReduce完成查询操作

    2020/03/10 大数据理论与架构