PLSC - 飞桨大规模分类库


Apache-2.0
跨平台
Python

软件简介

飞桨大规模分类(PLSC: P addlePaddle L arge S cale C
lassification)库是基于飞桨平台构建的超大规模分类库,为用户提供从训练到部署的大规模分类问题全流程解决方案。

PLSC 特性

  • 支持超大规模分类:单机8张V100 GPU配置下支持的最大类别数扩大2.52倍,支持的类别数随GPU卡数的增加而增加;
  • 训练速度快:单机8张V100 GPU配置下,基于ResNet50模型的百万类别分类训练速度2,122.56 images/s, 并支持多机分布式训练和混合精度训练;
  • 支持训练训练卡数的调整:加载模型参数的热启动训练可以使用和预训练不同的GPU卡数,并自动进行参数转换;
  • base64格式图像数据预处理:提供base64格式图像数据的预处理,包括数据的全局shuffle,数据自动切分;
  • 支持自定义模型:PLSC内建ResNet50、ResNet101和ResNet152模型,并支持用户自定义模型;
  • 支持模型参数在HDFS文件系统的自动上传和下载;
  • 全流程解决方案:提供从训练到部署的大规模分类问题全流程解决方案。