小编典典

如何防止jsoup转换特殊字符?

java

请看下面的简化示例:

    public static void main(String[] args) {
       String html = "<html>\n" +
                    " <head></head>\n" +
                    " <body>\n" +
                    "  <div> \n" +
                    "   <p> 2 <= X </p> \n" +
                    "  </div>\n" +
                    " </body>\n" +
                    "</html>";
        Document doc = Jsoup.parse(html);                    
        System.out.println(doc.select("p").outerHtml());
    }

这打印出来,<p> 2 &lt;= X </p>但我希望所选的html部分照原样打印:<p> 2 <= X </p>。我如何告诉jsoup不要转换’<’符号?


阅读 418

收藏
2020-11-26

共1个答案

小编典典

可以使用jsoup。

使用jSoup
1.8.3,可以使用保留原始html的Parser.unescapeEntities方法。

import org.jsoup.parser.Parser;
...
String html = Parser.unescapeEntities(original_html, false));

在某些以前的版本中,不存在此方法。

从此链接了解更多信息。

2020-11-26