Snorkel - 快速创建训练数据的系统


Apache-2.0
跨平台
Python

软件简介

Snorkel
是一种快速创建、建模和管理训练数据的系统,目前主要聚焦在加速开发结构化或“黑暗”数据提取的应用程序,该应用程序适用于大规模标注训练集不切实际或不容易获取的领域。

Snorkel 基于新的数据编程(data
programming)
模式,开发人员专注于编写一组 标记函数(labeling
functions)
,这些 函数 只是以编程方式标记数据的脚本。由此产生的标签是杂乱的,但 Snorkel
可自动建模这个过程进行学习,本质上,标签函数比其他的更精确,然后用它来训练最终模型(例如,TensorFlow 中的深度神经网络)。