介绍用于block的标识信息,数据信息,元数据和锁管理
介绍Spark中的存储体系
介绍大数据中的常用压缩和哈希算法
简要介绍大数据常用的数据结构
简要介绍常用一致性协议。
大数据系统中,一般采用同一数据多个副本保证可用性,这就带来了数据一致性问题。
大数据背景下,传统纵向拓展的方式即增加机器的配置已经无法满足数据量的需要,因此主流大数据系统基本采用横向拓展即增加机器数量,对数据的分片与路由显得尤为重要。
Spark中的顶层RPC环境架构及总结
Spark Rpc中的传输层,介绍TransportContext, TransportClientFactory, TransportResponseHandler, TransportRequestHandler, TransportChannelHandler, TransportClient, TransportServer
Spark RPC中的底层的流数据处理与消息传输
基于web的动物识别专家系统
CNN for predicting the quality of the welding
微信自动回复机器人
coursera 数据结构基础 算法基础 高级数据结构与算法 编程题
基于spark的Apriori算法