使用ASP.NET,如何可靠地剥离给定字符串中的HTML标签(即不使用正则表达式)?我正在寻找类似PHP的东西strip_tags。
strip_tags
<ul><li>Hello</li></ul>
“你好”
我正在努力不重新发明轮子,但是到目前为止,我还没有找到任何满足我需求的东西。
如果只是从字符串中剥离 所有 HTML标记,那么这也可以与regex一起 可靠地 工作。更换:
<[^>]*(>|$)
与空字符串,全局。不要忘了之后将字符串标准化,替换为:
[\s\r\n]+
与单个空格,并修剪结果。(可选)将所有HTML字符实体替换回实际字符。
注意事项 :
>