温馨提示:该项目除了使用 BSD 协议授权外,还需遵守附加的专利授权。
FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
FastText是一个旨在协助创建文本表达和分类的可伸缩解决方案的资料库。它最主要的一个优势是适用于非常大的数据库、某种深度神经网络——其中一种经常被拿来解决文本分类问题的解决方案,这意味着它能用于协助文本处理。
FastText能够在几秒钟或几分钟内完成某一个大型数据库的培训。类似于它这样的系统已经在网络的垃圾邮件过滤中得到运用,相信伴随着fastText的开源,像Siri、Google Now等这样的语音助手将能更有效地对自然语言展开解析。
使用环境:
(gcc-4.6.3 or newer) or (clang-3.3 or newer)
python 2.6 or newer
numpy & scipy
安装:
$ git clone git@github.com:facebookresearch/fastText.git $ cd fastText $ make