是否存在现有的Java库,该库提供了一种从字符串中剥离所有HTML标记的方法?我正在寻找strip_tags与PHP中的功能等效的东西。
strip_tags
我知道我可以使用这个问题中描述的正则表达式,但是我很好奇,是否可能已经有一种stripTags()方法可以在Apache Commons库中的某个地方使用。
stripTags()
在开放了将近一个星期的问题之后,我可以肯定地说,Java API或Apache库中没有可用的方法可从字符串中剥离HTML标记。您将不得不使用前面的答案中所述的HTML解析器,或者编写一个简单的正则表达式来去除标签。