我正在使用 Python 绑定来运行 Selenium WebDriver:
from selenium import webdriver wd = webdriver.Firefox()
我知道我可以像这样抓取一个网络元素:
elem = wd.find_element_by_css_selector('#my-id')
而且我知道我可以通过…获得整页源代码…
wd.page_source
但是有没有办法获得“元素来源”?
elem.source # <-- returns the HTML as a string
Python 的 Selenium WebDriver 文档基本上不存在,我在代码中看不到任何似乎启用该功能的东西。
访问元素(及其子元素)的 HTML 的最佳方式是什么?
您可以读取innerHTML属性以获取元素 内容 的来源或outerHTML获取当前元素的来源。
innerHTML
outerHTML
Python:
element.get_attribute('innerHTML')
爪哇:
elem.getAttribute("innerHTML");
C#:
element.GetAttribute("innerHTML");
红宝石:
element.attribute("innerHTML")
JavaScript:
element.getAttribute('innerHTML');
PHP:
$element->getAttribute('innerHTML');
它已经过测试并与ChromeDriver.
ChromeDriver