Skip to content

Latest commit

 

History

History
4 lines (3 loc) · 350 Bytes

Introduction.md

File metadata and controls

4 lines (3 loc) · 350 Bytes

Deep Dive into Apache Spark

Apache Spark是目前最受欢迎的开源大数据处理框架,2014年2月成为Apache顶级项目, 2016年7月发布Spark 2.0, 同年12月发布Spark 2.1.0, 这个系列源码学习笔记基于最新发布的稳定版本Spark 2.1.0。

Apache Spark™ is a fast and general engine for large-scale data processing.