爬虫实例（二）—— 爬取高清4K图片

2年前 (2023-02-02)未命名92

爬虫实例（二）—— 爬取高清4K图片 Enovo_飞鱼于2023-02-01 08:00:00发布 1660 收藏 46 分类专栏：爬虫文章标签：爬虫 python 开发语言爬虫专栏收录该内容 2 篇文章 0 订阅订阅专栏

大家好，我是 Enovo飞鱼，今天继续分享一个爬虫案例，爬取高清4K图片，加油💪。

前言

增加异常处理

增加代码灵活性

基本环境配置

爬取目标网站

分析网站页面

具体代码实现

图片下载示例

感谢支持🙇‍+👍

前言

上篇内容，我们已经了解并惊叹于5行Python代码的强大，今天我们会继续挖掘，并且在原有的基础上进行不断地完善

我们将考虑到多方面的内容，例如，增加异常处理，增加代码灵活性，加快爬取速度……

增加异常处理

由于爬取上百页的网页，中途很可能由于各种问题导致爬取失败，所以增加了 try except 、if else 等语句，来处理可能出现的异常，让代码更健壮。

增加代码灵活性

初版代码由于固定了 URL 参数，所以只能爬取固定的内容，但是人的想法是多变的，一会儿想爬这个一会儿可能又需要那个，所以可以通过修改 URL 请求参数，来增加代码灵活性，从而爬取更灵活的数据。

基本环境配置

版本：Python3

系统：Windows

相关代码：

import requests from lxml import etree headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0' } x = input('输入页数： ') for page in range(1, int(x)): if page == 1: url = 'https://pic.netbian.com/4kyingshi/' else: url = 'https://pic.netbian.com/4kyingshi/index_' + str(page) + '.html' response = requests.get(url=url, headers=headers) response.encoding = 'gbk' # 或者gb2312 page_text = response.text tree = etree.HTML(page_text) # 以下三种均可 # li_list = tree.xpath('//div[@id="main"]/div[3]/ul/li[1]/a/img') #li_list = tree.xpath('//div[@class="slist"]/ul/li') li_list = tree.xpath('//div[@id="main"]/div[@class="slist"]/ul/li') for li in li_list: img_src = 'https://pic.netbian.com/' + li.xpath('./a/img/@src')[0] img_name = li.xpath('./a/b/text()')[0] + '.jpg' img = requests.get(url=img_src, headers=headers).content with open('./wwww/' + img_name, 'wb') as fp: fp.write(img) print(img_name + '保存') # //*[@id="main"]/div[3]/ul/li[1]/a # copy xpath

到现在为止，已经拿到了所有的图片的链接和名字，那么就可以开始下载了

运行代码，输入你需要下载的页数即可🐒

图片下载示例

总共是爬了两页图片，做个示例

见下图 ↓

感谢支持🙇‍+👍

标签: [db:标签TAG]

返回列表

上一篇：年前花2个月面过阿里测开岗，拿个27K也不过分吧？

下一篇：我们来了解下什么是架构

爬虫实例（二）—— 爬取高清4K图片

相关文章

【C++】打开C++的大门

大数据分析案例-基于随机森林算法构建新闻文本分类模型

既然有MySQL了，为什么还要有MongoDB？

nginx的高可用---Keepalived

Redis 被问麻了...

人工智能原理复习 | 归结原理

Copyright Your WebSite.Some Rights Reserved.

Powered By Z-BlogPHP. Theme by TOYEAN.

爬虫实例（二）—— 爬取高清4K图片

相关文章

【C++】打开C++的大门

大数据分析案例-基于随机森林算法构建新闻文本分类模型

既然有MySQL了，为什么还要有MongoDB？

nginx的高可用---Keepalived

Redis 被问麻了...

人工智能原理复习 | 归结原理

Copyright Your WebSite.Some Rights Reserved.var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?30b336128641baa43b1404dd15891277"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

Copyright Your WebSite.Some Rights Reserved.