在我看到的BeautifulSoup的所有示例和教程中,都传递了HTML / XML文档,并返回了汤对象,然后可以使用该对象来修改文档。但是,如何使用BeautifulSoup从头开始创建HTML / XML文档?换句话说,我有要放入XML文件中的数据,但是XML文件尚不存在,我想从头开始构建它。我该怎么办?
只需创建一个空BeautifulSoup()对象:
BeautifulSoup()
soup = BeautifulSoup()
并开始添加元素:
soup.append(soup.new_tag("a", href="http://www.example.com"))
对于XML,可以使用xml树构建器以XML标头开始:
xml
soup = BeautifulSoup(features='xml')
这要求首先安装lxml。这将在对象.is_xml上设置标志BeautifulSoup(也可以手动设置)。
.is_xml
BeautifulSoup