1. YARN原理解析

    YARN(Yet Another Resource Negotiator)的设计思想就是分离资源管理和job的调度/监控

    2020/02/29 大数据理论与架构

  2. Hadoop MapReduce原理解析

    MapReduce编程模型实现了并行化,高容错的方式来处理大规模计算

    2020/02/27 大数据理论与架构

  3. HDFS原理解析

    HDFS是一个高容错,大文件存储,高吞吐量的分布式文件系统

    2020/02/25 大数据理论与架构

  4. 浅析Spark SQL

    Spark中的重要模块,在Spark的函数式编程API中引入了关系数据的处理

    2020/02/14 Spark

  5. 基于Spark的Apriori算法

    用Spark实现了频繁项集挖掘算法,记录自己实践中的思考

    2020/01/31 Spark

  6. Spark RDD 算子 共享变量

    Spark中的重要概念,RDD,算子与共享变量

    2020/01/28 Spark

  7. B树与B+树

    静态索引结构在初始创建时就已经定型,而且在运行期间,其结构不发生变化,存取方便,但插入删除效率低。动态索引结构在运行期间,其结构随着增删而调整,以保持最佳搜索效率。B树与B+树就属于动态索引结构。

    2019/12/17 算法和数据结构

  8. 线性表检索与静态索引检索

    线性表检索与静态索引检索的实现与比较

    2019/12/13 算法和数据结构

  9. 哈希表检索

    哈希表检索的实现

    2019/12/11 算法和数据结构

  10. 外排序算法

    外排序算法的实现和比较

    2019/11/30 算法和数据结构