女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

女神不是那么好爬的,每天都搞得面红耳赤心塞塞。各位自备zi jin啊!

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

首先用Python 2.7和3.6爬取妹子图网站单页测试图片

一、url= http://www.mzitu.com/74100/x,2为1到23的值

二、用到模块 os 创建文件目录; re模块正则匹配目录名 图片下载地址; time模块 限制下载时间;requests模块获取网页源代码;urllib模块 urllib.urlretrieve(图片url,保存的带扩展名的文件名x.jpg)方法下载图片

三、知识点 文件目录处理 函数封装调用 全局变量

四、上代码

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

继续再来爬取“女神吧”女神

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

来来来上代码:

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

结果来了:

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

嗨呀,这个爬虫还是有点不完善,除了几个女神的图片外还多了一些不知道啥玩意的东西,不过总的来说还是爬到了女神,

我们要少一些功利主义的追求,多一些不为人知的坚持!

最近比较爱好新恒结衣,被大只萝莉萌的一脸一脸的,我们来百度一波新恒结衣,搜罗女神的皂片。

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

这个案例主要分为:下载简单页面、爬取多张图片、页面解码、爬取过程排错处理4个部分。

一、下载简单页面

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

代码不截图过不了文章

其中urlretrieve方法,直接将远程数据下载到本地。

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

女友出轨,少年怒爬上万妹子照片,爬取下来的内容恕我不敢直视!

小伙伴需要资料的话可以在后台私信回复我01,系统检测到关键字自动发送。


分享到:


相關文章: