Scalable 表格 ( SFrame , SArray ) 和图形 ( SGraph ) 数据结构用于数据分析。SFrame 提供下列结构的完整实现:
SFrame
SArray
SGraph
C++ SDK surface area (gl_sframe, gl_sarray, gl_sgraph)
SFrame 包含来自 Dato 的开源组件 GraphLab Create 。
SFrame 关键特性:
一个可伸缩的列压缩,基于磁盘后端存储的数据帧,为机器学习和数据科学研究优化.
主要为表格和图形数据而设计
支持强类型化的数据列和弱类型列
统一支持数据丢失处理
查询优化以及延迟仿真
A C API (gl_sarray, gl_sframe, gl_sgraph) with direct native access via the C SDK.
A Python API (SArray, SFrame, SGraph) with an indirect access via an interprocess layer.
环境要求:
SFrame 要求 64 位操作系统
操作系统
Mac OS X: 10.8+
Linux: Any distribution with GLIBC >= 2.11
Ubuntu >= 11.04
Debian >= 6
RHEL >= 6
SLES >= 11
Windows (7, 8, 10, Server 2012 R2)
Python
Python 2.7.x
Note : Unfortunately, Python 3.x is currently not supported.