Hivemall 是一个可扩展的机器学习算法工具,可在 Apache Hive、Apache Spark 和 Apache Pig 上运行。
Hivemall 基于 Hive UDF,在工业实践应用中非常方便,方便数据科学家快速构建机器学习模型原型。
项目状态:目前为 Apache 孵化项目,支持列表如下:
Binary Classification Metrics
Multi-label Classification Metrics
Regression Metrics
Ranking Measures
Data Generation