我有这样的HTML文本:
<xml ... >
我想将其转换为可读的内容:
<xml ...>
在Python中有任何简单(快速)的方法吗?
官方文档HTMLParser:Python 2.7
HTMLParser
>>> import HTMLParser >>> pars = HTMLParser.HTMLParser() >>> pars.unescape('© €') u'\xa9 \u20ac' >>> print _ © €
官方文档HTMLParser:Python 3
>>> from html.parser import HTMLParser >>> pars = HTMLParser() >>> pars.unescape('© €') © €