.NET下的文本数据抽取库,能够支持许多常用文件格式,如 docx, xlsx, xls, pdf, csv, txt, vcf, html等,是数据挖掘领域不可多得利器。类似于Java的Tika项目。
Toxy由Neuzilla(纽创科技)创建并维护,请关注Neuzilla