Snorkel 是一种快速创建、建模和管理训练数据的系统,目前主要聚焦在加速开发结构化或“黑暗”数据提取的应用程序,该应用程序适用于大规模标注训练集不切实际或不容易获取的领域。
Snorkel 基于新的数据编程(data programming)模式,开发人员专注于编写一组 标记函数(labeling functions) ,这些 函数 只是以编程方式标记数据的脚本。由此产生的标签是杂乱的,但 Snorkel 可自动建模这个过程进行学习,本质上,标签函数比其他的更精确,然后用它来训练最终模型(例如,TensorFlow 中的深度神经网络)。