小编典典

如何在不知道其中包含哪些标签的情况下从字符串中删除所有 HTML 标签?

all

有什么简单的方法可以从字符串中删除所有 HTML 标签或任何与 HTML 相关的内容吗?

例如:

string title = "<b> Hulk Hogan's Celebrity Championship Wrestling &nbsp;&nbsp;&nbsp;<font color=\"#228b22\">[Proj # 206010]</font></b>&nbsp;&nbsp;&nbsp; (Reality Series, &nbsp;)"

上面真的应该是:

“绿巨人霍根的名人冠军摔跤 [项目#206010](现实系列)”


阅读 57

收藏
2022-08-17

共1个答案

小编典典

您可以使用这样的简单正则表达式:

public static string StripHTML(string input)
{
   return Regex.Replace(input, "<.*?>", String.Empty);
}

请注意,此解决方案有其自身的缺陷。 有关更多信息,请参阅删除字符串中的 HTML
标记
(尤其是 ‘Mark E. Haase’/@mehaase 的注释)

2022-08-17