ELI5 - 使用统一 API 可视化地调试各种机器学习模型


MIT
跨平台
Python

软件简介

ELI5是一个Python库,允许使用统一API可视化地调试各种机器学习模型。
它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。

它为以下机器学习框架和包提供支持:

  • scikit-learn。目前,ELI5允许解释scikit-learning线性分类器和回归量的权重和预测,将决策树打印为文本或SVG,显示特征重要性并解释决策树和基于树的集合的预测。支持Pipeline和FeatureUnion。ELI5通过scikit-learn了解文本处理实用程序,并可相应地突出显示文本数据。它还允许通过撤消散列来调试包含HashingVectorizer的scikit-learn管道。
  • XGBoost - 显示功能重要性并解释XGBClassifier,XGBRegressor和xgboost.Booster的预测。
  • LightGBM - 显示功能重要性并解释LGBMClassifier和LGBMRegressor的预测。
  • lightning - 解释闪电分类器和回归量的权重和预测。
  • sklearn-crfsuite。 ELI5允许检查sklearn_crfsuite.CRF模型的权重。

ELI5还实现了几种检测黑盒模型的算法(参见检查黑盒估算器):

  • TextExplainer允许使用LIME算法解释任何文本分类器的预测(Ribeiro等,2016)。有一些实用程序可以将LIME与非文本数据和任意黑盒分类器一起使用,但此功能目前是实验性的。
  • Permutation Importance方法可用于计算黑盒估计器的特征重要性。