Apache Falcon - Hadoop 数据管理平台


Apache
跨平台
Java

软件简介

Apache Falcon 提供了一个用于治理和编排 Hadoop
内部和周边数据流的数据处理框架。该框架为获取和处理数据集、复制与保留数据集、重新定向位于非Hadoop扩展中的数据集、维护审核跟踪与沿袭提供了关键性的管控框架。Knox拓展了Hadoop的安全边界,实现了与LDAP、用于证书管理的活动目录等框架进行了充分整合,为跨Hadoop和所有相关项目的授权提供了一个通用服务。

整体架构:

Feed Schedule flow

Process Schedule flow