介绍Spark中的存储体系
介绍大数据中的常用压缩和哈希算法
简要介绍大数据常用的数据结构
简要介绍常用一致性协议。
大数据系统中,一般采用同一数据多个副本保证可用性,这就带来了数据一致性问题。
大数据背景下,传统纵向拓展的方式即增加机器的配置已经无法满足数据量的需要,因此主流大数据系统基本采用横向拓展即增加机器数量,对数据的分片与路由显得尤为重要。
Spark中的顶层RPC环境架构及总结
Spark Rpc中的传输层,介绍TransportContext, TransportClientFactory, TransportResponseHandler, TransportRequestHandler, TransportChannelHandler, TransportClient, TransportServer
Spark RPC中的底层的流数据处理与消息传输
总结scala反射中的基本概念。