LASER - 可探索大量多语言句子表征形式的工具


CC BY-NC 4.0
跨平台
Python

软件简介

LASER 是个计算和使用多语言句子嵌入的库,为的是加速自然语言处理在多语言上进行的零样本迁移。

LASER 拥有以下优势:

  • 极快的性能,能在 GPU 上每秒处理多达 2000 个句子。

  • 句子编码器是在 PyTorch 中实现的,只需要很少的外部依赖。

  • 资源有限的语言可以从多个语言的联合训练中受益。

  • 该模型支持在一个句子中使用多种语言。

  • 随着新语言的加入,系统会学习识别其语系特征,从而使相关性能有所提高。