我正在尝试抓取'</html>'标签后的所有内容并将其删除,但我的代码似乎没有做任何事情。不.replace()支持正则表达式?
'</html>'
.replace()
z.write(article.replace('</html>.+', '</html>'))
不会。Python 中的正则表达式由re模块处理。
re
article = re.sub(r'(?is)</html>.+', '</html>', article)
一般来说:
text_after = re.sub(regex_search_term, regex_replacement, text_before)