如果页面上有<div class="class1">和<p class="class1">,soup.findAll(True, 'class1')则将同时找到它们。
<div class="class1">
<p class="class1">
soup.findAll(True, 'class1')
如果具有<p class="class1 class2">,则将找不到它。如何查找具有特定类的所有对象,而不管它们是否也具有其他类?
<p class="class1 class2">
以防万一有人遇到这个问题。BeautifulSoup现在支持此功能:
Python 2.7.5 (default, May 15 2013, 22:43:36) [MSC v.1500 32 bit (Intel)] Type "copyright", "credits" or "license" for more information. In [1]: import bs4 In [2]: soup = bs4.BeautifulSoup('<div class="foo bar"></div>') In [3]: soup(attrs={'class': 'bar'}) Out[3]: [<div class="foo bar"></div>]
另外,您不必再键入findAll。