我试图使用C#从MS Word(.doc,.docx),Excel和Powerpoint提取文本(字符串)。在哪里可以找到免费且简单的.Net库来读取MS Office文档?我尝试使用NPOI,但没有获得有关如何使用NPOI的样本。
使用PInvokes,可以使用IFilter界面(在Windows上)。Windows附带了许多常见文件类型的IFilter(您可以使用此工具浏览它们。您可以要求IFilter从文件中返回文本。有几套示例代码(这里是一个这样的示例)。