LASER 是个计算和使用多语言句子嵌入的库,为的是加速自然语言处理在多语言上进行的零样本迁移。
LASER 拥有以下优势:
极快的性能,能在 GPU 上每秒处理多达 2000 个句子。
句子编码器是在 PyTorch 中实现的,只需要很少的外部依赖。
资源有限的语言可以从多个语言的联合训练中受益。
该模型支持在一个句子中使用多种语言。
随着新语言的加入,系统会学习识别其语系特征,从而使相关性能有所提高。