我想要一个正则表达式来从 HTML 页面中提取标题。目前我有这个:
title = re.search('<title>.*</title>', html, re.IGNORECASE).group() if title: title = title.replace('<title>', '').replace('</title>', '')
是否有正则表达式可以仅提取
( )在 regexp 和python 中使用group(1)来检索捕获的字符串(如果没有找到结果re.search会返回,所以 不要 直接 使用):None group()
(
)
group(1)
re.search
None
group()
title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE) if title_search: title = title_search.group(1)