Apache Spark教程


Spark教程

Spark教程

Apache Spark是一款快速集群计算,专为快速计算而设计。它建立在Hadoop MapReduce之上,它扩展了MapReduce模型以有效地使用更多类型的计算,其中包括交互式查询和流处理。这是一个简要的教程,解释Spark Core编程的基础知识。

适合人群

本教程为有志于使用Spark Framework学习大数据分析基础并成为Spark开发人员的专业人员准备。此外,它对分析专业人员和ETL开发人员也很有用。

预备知识

在开始本教程之前,我们假设您已经接触过Scala编程数据库概念和任何Linux操作系统

Spark API类库

更多Spark API详细内容,请参考:Spark API类库

Spark教程内容导航