拨打电话urllib2时是否提取整个页面urlopen?
urllib2
urlopen
我只想读取HTTP响应标头而不获取页面。看起来像urllib2打开HTTP连接,然后随后获取实际的HTML页面……还是只是通过urlopen调用来开始缓冲页面?
import urllib2 myurl = 'http://www.kidsidebyside.org/2009/05/come-and-draw-the-circle-of-unity-with-us/' page = urllib2.urlopen(myurl) // open connection, get headers html = page.readlines() // stream page
使用该response.info()方法获取标题。
response.info()
从urllib2文档:
urllib2.urlopen(url [,data] [,timeout]) … 此函数返回带有两个其他方法的文件状对象: geturl()—返回所获取资源的URL,通常用于确定是否遵循了重定向 info()—以httplib.HTTPMessage实例的形式返回页面的元信息,例如标头(请参阅HTTP标头快速参考)
urllib2.urlopen(url [,data] [,timeout])
…
此函数返回带有两个其他方法的文件状对象:
因此,对于您的示例,请尝试逐步response.info().headers查找所需的结果。
response.info().headers
请注意使用httplib的主要警告.HTTPMessage在python问题4773中进行了说明。