从String中删除HTML标记


从String中删除HTML标记

使用HTML解析器而不是正则表达式。使用Jsoup这很简单。

public static String html2text(String html) {
    return Jsoup.parse(html).text();
}

Jsoup还支持对可定制的白名单,如果你希望只允许例如这是非常有用的去除HTML标签<b><i><u>

如果你正在为Android,你可以这样做......

android.text.Html.fromHtml(instruction).toString()