FastText - 快速文本分类器


BSD
跨平台
C/C++

软件简介

温馨提示:该项目除了使用 BSD
协议授权外,还需遵守附加的专利授权

FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。

FastText是一个旨在协助创建文本表达和分类的可伸缩解决方案的资料库。它最主要的一个优势是适用于非常大的数据库、某种深度神经网络——其中一种经常被拿来解决文本分类问题的解决方案,这意味着它能用于协助文本处理。

FastText能够在几秒钟或几分钟内完成某一个大型数据库的培训。类似于它这样的系统已经在网络的垃圾邮件过滤中得到运用,相信伴随着fastText的开源,像Siri、Google
Now等这样的语音助手将能更有效地对自然语言展开解析。

使用环境:

  • (gcc-4.6.3 or newer) or (clang-3.3 or newer)

  • python 2.6 or newer

  • numpy & scipy

安装:

$ git clone git@github.com:facebookresearch/fastText.git
$ cd fastText
$ make