基本上,我想解码给定的HTML文档,并替换所有特殊字符,例如" "-> " ",">"-> ">"。
" "-> " ",">"-> ">"
在.NET中,我们可以使用HttpUtility.HtmlDecode。
HttpUtility.HtmlDecode
Java中的等效功能是什么?
我已为此使用Apache Commons StringEscapeUtils.unescapeHtml4():
Apache Commons StringEscapeUtils.unescapeHtml4()
将包含实体转义符的字符串取消转义为包含与转义符相对应的实际Unicode字符的字符串。支持HTML 4.0实体。