如何从Python的字符串中删除所有HTML?例如,我该如何转向:
blah blah <a href="blah">link</a>
进入
blah blah link
谢谢!
您可以使用正则表达式删除所有标签:
>>> import re >>> s = 'blah blah <a href="blah">link</a>' >>> re.sub('<[^>]*>', '', s) 'blah blah link'