使用 Python,Elasticsearch 和 Kibana 进行实时异常检测的开源框架。
该项目的目的是执行以下功能:
消耗从各种文件和流格式的数据。
实时转换数据流以获取感兴趣的统计信息,如聚合,计数,会话,分组或提取功能。
通过无监督的机器学习对产生的流进行建模,以全局或者在设备/用户层面捕获正常的基线行为。
通过将每个新事件与基准模型进行比较来评分。
在轻量级可定制仪表板上可视化异常事件,并且轻量级的后端。
推荐的安装方法是在 Python 3.x virtalenv 中使用 pip。
virtualenv --python=python3 dsio-env source dsio-env/bin/activate pip install -e git+https://github.com/MentatInnovations/datastream.io#egg=dsio
您可以通过命令行使用 dsio 或将其导入到您的 Python 代码中。您可以使用内置的 Bokeh 服务器可视化您的数据流,也可以将它们重新定位到 Elasticsearch,并使用 Kibana 对其进行可视化。在任何一种情况下,dsio 都会为您的数据流生成适当的仪表板。另外,如果您通过 Jupyter 笔记本调用 dsio,则会将流式 Bokeh 仪表板嵌入到同一个笔记本中。