SGMLReader - HTML 和 SGML 解析库


Apache
Windows
C#

软件简介

SgmlReader 是一个敏捷的 C# .NET 库,通过 XmlReader API 解析 HTML 和 SGML
文件。同时提供一个命令行工具可以对这些内容进行格式化输出到 XML 结果。

示例代码:

XmlDocument FromHtml(TextReader reader) {

    // setup SgmlReader
    Sgml.SgmlReader sgmlReader = new Sgml.SgmlReader();
    sgmlReader.DocType = "HTML";
    sgmlReader.WhitespaceHandling = WhitespaceHandling.All;
    sgmlReader.CaseFolding = Sgml.CaseFolding.ToLower;
    sgmlReader.InputStream = reader;

    // create document
    XmlDocument doc = new XmlDocument();
    doc.PreserveWhitespace = true;
    doc.XmlResolver = null;
    doc.Load(sgmlReader);
    return doc;
}