小编典典

从BeautifulSoup / Python中删除跨度标签

python

我在Python中有这样的汤:

<p>
 <span style="text-decoration: underline; color: #3366ff;">
   Title:
 </span>
 Info
</p>
<p>
 <span style="color: #3366ff;">
  <span style="text-decoration: underline;">
   Title2:
  </span>
 </span>
 Info2
</p>

我想让它看起来像这样:

<p>
   Title:
 Info
</p>
<p>
   Title2:
 Info2
</p>

有没有办法用bs4做到这一点?


阅读 225

收藏
2020-12-20

共1个答案

小编典典

您将需要为此使用beautifulsoup的unwrap()

import bs4
soup1 = bs4.BeautifulSoup(htm1, 'html.parser')
for match in soup1.findAll('span'):
    match.unwrap()
print soup1
2020-12-20