RF.go - 随机森林库


MIT
Windows
Google Go

软件简介

在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele
Cutler发展出推论出随机森林的算法。 而 “Random Forests” 是他们的商标。 这个术语是1995年由贝尔实验室的Tin Kam
Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合 Breimans 的 “Bootstrap
aggregating” 想法和 Ho 的”random subspace method”” 以建造决策树的集合。

1) RF.go 是用Go语言写的随机森林库
2) RF.go 可以以并行化的方式训练,对于每一颗决策树绑定一个go routine, 从而充分利用多核CPU。
3) 在著名的手写体识别图片库MNIST上, RF.go可以达到2.8%的错误率,在100颗决策树的配置下
4) RF.go即支持分类也支持回归. 例子和用法可以在项目代码库中找到.
5) RF.go支持数据结构在内存和硬盘之间交换,以JSON的格式。