Python爬虫之用Python爬取某图网4000张图片-职坐标

海同科技，欢迎您！

就业

学习

资料

IT知识库

编程语言

站

热门城市全国站>

其他省市

快速购买

15692118659

热门课程

IT学院

职坐标首页 IT知识库编程语言 Python

选择在海同提升： 30 天 1510 名，今日申请 54 人 IT技术咨询 >>

Python爬虫之用Python爬取某图网4000张图片

小职 2021-05-28 来源：菜J学Python 阅读 1656 评论 0

摘要：本文主要介绍了Python爬虫之用Python爬取某图网4000张图片，通过具体的内容向大家展现，希望对大家Python的学习有所帮助。

本文主要介绍了Python爬虫之用Python爬取某图网4000张图片，通过具体的内容向大家展现，希望对大家Python的学习有所帮助。

Python爬虫之用Python爬取某图网4000张图片

相信很多设计小伙伴有好的灵感，但是没有好的设计素材,今天它来了。摄图网4000张设计素材，取之不尽，如下图所示：

Python爬虫之用Python爬取某图网4000张图片

好了，废话不多说，开始用Python采集。

01需求分析

采集摄图网的素材图片，目标网址-->请求数据-->解析数据-->提取数据-->保存数据。

02技术栈

首先我们用到的技术包括：urllib，requests，bs4等。

03采集流程

1、分析网页结构

打开网址:https://699pic.com/paihang/tupian.html,分析网页结构,我们可以看到首页图片数据杂论,这里我们爬取的是"今日热门"的图片,点击发现更多:来到目标页面,拖动滚轮滑到底部,发现有40个分页,也就是我们今天要爬取的4000张设计图片：

Python爬虫之用Python爬取某图网4000张图片

2、发起请求

接着对列表中的每一条url进行遍历,然后发起请求：

for url in urllist:

resp = requests.get(url,headers=hd)

html = resp.content.decode('utf-8')

3、数据解析

得到了一个html对象,爬取页面数据信息后,需要对页面进行解析,这里我使用到的解析库是bs4(偏爱),当然xpath也是可以的。通过分析页面元素,我们发现每个翻页里面的图片都有这样的规律：

Python爬虫之用Python爬取某图网4000张图片

因此可以通过bs4的select方法抓取所有class='lazy'的img标签,得到一个列表,然后通过测试发现图片的链接存放在img标签的data-original属性里,通过img.attrs['data-original']得到,再与'https:'进行字符串拼接,得到完整图片链接。

for img in imgs:

img_url = img.attrs['data-original']

total_url = base_http_str + img_url

print(total_url)

# print('--'*60)

imgurllist.append(total_url)

4.提取保存数据

最后运用urllib中的urlretrive方法,把图片保存到本地。

def writeData(imgurllist):

for index,url in enumerate(imgurllist):

urllib.request.urlretrieve(url,'image/'+ '%s.png'%index)

print('第%s张图片下载完成'%index)

04运行爬虫

运行爬虫代码，效果如下：

Python爬虫之用Python爬取某图网4000张图片

图片就下载完成了，不过运用传统方法有点慢，下次试试多线程，提升爬虫效率。

我是小职，记得找我

✅ 解锁高薪工作

✅ 免费获取基础课程·答疑解惑·职业测评

Python爬虫之用Python爬取某图网4000张图片

python爬虫实战代码 python编程入门到实践 python爬虫实战项目

本文由 @小职发布于职坐标。未经许可，禁止转载。

喜欢 | 0

不喜欢 | 0

看完这篇文章有何感觉？已经有0人表态，0%的人喜欢快给朋友分享吧~

评论（0）

后参与评论

加入IT交流圈

JAVA工程师交流群 +加入

大数据架构师交流群 +加入

人工智能Python交流群 +加入

WEB/H5前端交流群 +加入

职坐标公众号

编程语言 直通车

资料领取
答疑解惑
技术交流
职业测评
面试技巧
高薪秘笈

海同专业团队更多>>

认证System Analyst，System Architect

15年全栈技术研发经验，中南大学、湖南师大等10+所高校特聘讲师

热门就业技能更多>>

【零基础】人工智能+Python全栈开发技术

【零基础】人工智能+Python全栈开发技术

人工智能+Python技术风口浪潮

【零基础】JavaEE高级开发技术

【零基础】JavaEE高级开发技术

起薪高，轻松进名企

【零基础】大数据与分布式架构技术

【零基础】大数据与分布式架构技术

培训大数据分布式架构

Python30天热搜词更多>>

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场匹配合适岗位

验证码手机号，获得海同独家IT培训资料

选择就业方向：: 人工智能物联网; 大数据开发/分析; 人工智能Python; Java全栈开发; WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了，明天再试试吧！

提交

我们会在第一时间安排职业规划师联系您！

您也可以联系我们的职业规划师咨询：

小职老师的微信号：z_zhizuobiao

小职老师的微信号：z_zhizuobiao

版权所有职坐标-一站式AI+学习就业服务平台沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com，All Rights Reserved.
沪公网安备 31011502005948号

关于我们 │ 法律声明 │ 联系我们

©2015 www.zhizuobiao.com All Rights Reserved