我想要一个正则表达式从HTML页面提取标题。目前我有这个:
title = re.search('<title>.*</title>', html, re.IGNORECASE).group() if title: title = title.replace('<title>', '').replace('</title>', '')
是否有一个正则表达式仅提取<title>的内容,所以我不必删除标签?
<title>
用( )在正则表达式和group(1)python中检索捕获的字符串(re.search将返回None如果没有找到结果,所以不要用group()直接):
( )
group(1)python
re.search
None
group()
title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE) if title_search: title = title_search.group(1)