Shark - 数据仓库系统


Apache
跨平台
Scala

软件简介

Shark 是一个大型的数据仓库系统为 Spark 的设计与
Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快
30 倍。支持 Hive 查询语言、元存储、序列化格式和用户自定义函数。

要求:

  • Scala 2.10.3

  • AMPLab’s Hive 0.11

  • Spark 0.9.x