小编典典

Python:是否从urllib2.urlopen调用获取HTTP标头?

python

拨打电话urllib2时是否提取整个页面urlopen

我只想读取HTTP响应标头而不获取页面。看起来像urllib2打开HTTP连接,然后随后获取实际的HTML页面……还是只是通过urlopen调用来开始缓冲页面?

import urllib2
myurl = 'http://www.kidsidebyside.org/2009/05/come-and-draw-the-circle-of-unity-with-us/'
page = urllib2.urlopen(myurl) // open connection, get headers

html = page.readlines()  // stream page

阅读 165

收藏
2020-12-20

共1个答案

小编典典

使用该response.info()方法获取标题。

urllib2文档

urllib2.urlopen(url [,data] [,timeout])

此函数返回带有两个其他方法的文件状对象:

  • geturl()—返回所获取资源的URL,通常用于确定是否遵循了重定向
  • info()—以httplib.HTTPMessage实例的形式返回页面的元信息,例如标头(请参阅HTTP标头快速参考)

因此,对于您的示例,请尝试逐步response.info().headers查找所需的结果。

请注意使用httplib的主要警告.HTTPMessage在python问题4773中进行了说明

2020-12-20