请看下面的简化示例:
public static void main(String[] args) { String html = "<html>\n" + " <head></head>\n" + " <body>\n" + " <div> \n" + " <p> 2 <= X </p> \n" + " </div>\n" + " </body>\n" + "</html>"; Document doc = Jsoup.parse(html); System.out.println(doc.select("p").outerHtml()); }
这打印出来,<p> 2 <= X </p>但我希望所选的html部分照原样打印:<p> 2 <= X </p>。我如何告诉jsoup不要转换’<’符号?
<p> 2 <= X </p>
<p> 2 <= X </p>
可以使用jsoup。
使用jSoup 1.8.3,可以使用保留原始html的Parser.unescapeEntities方法。
import org.jsoup.parser.Parser; ... String html = Parser.unescapeEntities(original_html, false));
在某些以前的版本中,不存在此方法。
从此链接了解更多信息。