我正在尝试从中文网站中抓取一些javascript生成的内容。我正在使用Selenium(和Python),因为我无法直接抓取javascript内容。
# -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.selenium import selenium import time import urllib2 import httplib import urllib import re import base64 browser = webdriver.Firefox() # Get local session of firefox browser.get("http://www...") # Load page (redacted here, but any works) browser.get_body_text() #Attempt to scrape body text
我得到以下错误:
'WebDriver' object has no attribute 'get_body_text'
实际上,我似乎无法在selenium.selenium类中调用任何命令。毫无疑问,我忽略了非常明显的事情。提前致谢。
from selenium import webdriver
html= browser.find_element_by_xpath(".//html")
html.text
.text是element对象的方法。步骤2是将分配element给名称html。
.text
element
html