使用Python删除子字符串

小编典典

使用Python删除子字符串

python

我已经从论坛中提取了一些信息。这是我现在拥有的原始字符串：

string = 'i think mabe 124 + <font color="black"><font face="Times New Roman">but I don\'t have a big experience it just how I see it in my eyes <font color="green"><font face="Arial">fun stuff'

我不喜欢的是子字符串"<font color="black"><font face="Times New Roman">"和"<font color="green"><font face="Arial">"。我确实想保留字符串的其他部分，除此之外。所以结果应该是这样的

resultString = "i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

我该怎么办？实际上，我使用漂亮的汤从论坛中提取了上面的字符串。现在，我可能更喜欢使用正则表达式删除该部分。

阅读 215

2020-12-20

共1个答案

小编典典

import re
re.sub('<.*?>', '', string)
"i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

该re.sub函数采用常规表达式，并将字符串中的所有匹配项替换为第二个参数。在这种情况下，我们正在搜索所有标签（'<.*?>'），然后将其替换为（''）。

将?用于在re非贪婪的搜索。

有关的更多信息re module。

2020-12-20