我有这个:
dates = soup.findAll("div", {"id" : "date"})
但是,我可以将id作为通配符搜索,因为id可以是date_1,date_2等等。
id
date_1
date_2
您可以提供可调用的过滤器:
dates = soup.findAll("div", {"id" : lambda L: L and L.startswith('date')})
或@DSM指出
dates = soup.findAll("div", {"id" : re.compile('date.*')})
因为BeautifulSoup将识别RegExp对象并调用其.match()方法。
.match()