小编典典

在Python 2.6中用相应的utf-8字符替换html实体

python

我有这样的HTML文本:

<xml ... >

我想将其转换为可读的内容:

<xml ...>

在Python中有任何简单(快速)的方法吗?


阅读 151

收藏
2020-12-20

共1个答案

小编典典

Python 2.7

官方文档HTMLParserPython
2.7

>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('&copy; &euro;')
u'\xa9 \u20ac'
>>> print _
© €

Python 3

官方文档HTMLParserPython
3

>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('&copy; &euro;')
© €
2020-12-20