SFrame - 数据分析处理组件


BSD
跨平台
Python

软件简介

Scalable 表格 ( SFrame , SArray ) 和图形 ( SGraph ) 数据结构用于数据分析。SFrame
提供下列结构的完整实现:

  • SFrame

  • SArray

  • SGraph

  • C++ SDK surface area (gl_sframe, gl_sarray, gl_sgraph)

SFrame 包含来自 Dato 的开源组件 GraphLab
Create

SFrame 关键特性:

  • 一个可伸缩的列压缩,基于磁盘后端存储的数据帧,为机器学习和数据科学研究优化.

  • 主要为表格和图形数据而设计

  • 支持强类型化的数据列和弱类型列

  • 统一支持数据丢失处理

  • 查询优化以及延迟仿真

  • A C API (gl_sarray, gl_sframe, gl_sgraph) with direct native access via the C SDK.

  • A Python API (SArray, SFrame, SGraph) with an indirect access via an interprocess layer.

环境要求:

SFrame 要求 64 位操作系统

操作系统

  • Mac OS X: 10.8+

  • Linux: Any distribution with GLIBC >= 2.11

    • Ubuntu >= 11.04

    • Debian >= 6

    • RHEL >= 6

    • SLES >= 11

  • Windows (7, 8, 10, Server 2012 R2)

Python

  • Python 2.7.x

  • Note : Unfortunately, Python 3.x is currently not supported.