PySpark中的分布式scikit-learn元估计器
sk-dist是一个用于机器学习的Python模块,构建于scikit-learn之上,并在Apache 2.0软件许可下发布。 sk- dist模块可以被认为是“分布式scikit-learn”,因为它的核心功能是将scikit-learn内置的joblib并行化的meta- estimator训练扩展到spark。
主要特点