小白学 Python 爬虫（34）：爬虫框架 Scrapy 入门基础（二）

2020-11-16 19:59:40 佚名

人生苦短，我用 Python

如果我的文章对您有帮助，请关注支持下作者的公众号：极客挖掘机，您的关注，是对小编坚持原创的最大鼓励：）

前文传送门：

小白学 Python 爬虫（1）：开篇

小白学 Python 爬虫（2）：前置准备（一）基本类库的安装

小白学 Python 爬虫（3）：前置准备（二）Linux基础入门

小白学 Python 爬虫（4）：前置准备（三）Docker基础入门

小白学 Python 爬虫（5）：前置准备（四）数据库基础

小白学 Python 爬虫（6）：前置准备（五）爬虫框架的安装

小白学 Python 爬虫（7）：HTTP 基础

小白学 Python 爬虫（8）：网页基础

小白学 Python 爬虫（9）：爬虫基础

小白学 Python 爬虫（10）：Session 和 Cookies

小白学 Python 爬虫（11）：urllib 基础使用（一）

小白学 Python 爬虫（12）：urllib 基础使用（二）

小白学 Python 爬虫（13）：urllib 基础使用（三）

小白学 Python 爬虫（14）：urllib 基础使用（四）

小白学 Python 爬虫（15）：urllib 基础使用（五）

小白学 Python 爬虫（16）：urllib 实战之爬取妹子图

小白学 Python 爬虫（17）：Requests 基础使用

小白学 Python 爬虫（18）：Requests 进阶操作

小白学 Python 爬虫（19）：Xpath 基操

小白学 Python 爬虫（20）：Xpath 进阶

小白学 Python 爬虫（21）：解析库 Beautiful Soup（上）

小白学 Python 爬虫（22）：解析库 Beautiful Soup（下）

小白学 Python 爬虫（23）：解析库 pyquery 入门

小白学 Python 爬虫（24）：2019 豆瓣电影排行

小白学 Python 爬虫（25）：爬取股票信息

小白学 Python 爬虫（26）：为啥买不起上海二手房你都买不起

小白学 Python 爬虫（27）：自动化测试框架 Selenium 从入门到放弃（上）

小白学 Python 爬虫（28）：自动化测试框架 Selenium 从入门到放弃（下）

小白学 Python 爬虫（29）：Selenium 获取某大型电商网站商品信息

小白学 Python 爬虫（30）：代理基础

小白学 Python 爬虫（31）：自己构建一个简单的代理池

小白学 Python 爬虫（32）：异步请求库 AIOHTTP 基础入门

小白学 Python 爬虫（33）：爬虫框架 Scrapy 入门基础（一）

引言

在上一篇文章小白学 Python 爬虫（33）：爬虫框架 Scrapy 入门基础（一）中，我们简单的使用了 Spider 抓取到了我们需要的信息，我们简单的将我所需要的信息通过 print() 的方式打印了在了控制台上。

在我们实际使用爬虫的过程中，我们更多的是需要将数据保存起来，并不是直接输出至控制台，本篇文章接着讲我们如何将 Spider 抓取到的信息保存起来。

Item

Item 的主要目的是从非结构化源（通常是网页）中提取结构化数据。

Scrapy Spider可以将提取的数据作为Python字典返回。Python字典虽然方便且熟悉，但缺乏结构：很容易在字段名称中输入错误或返回不一致的数据，尤其是在具有许多蜘蛛的大型项目中。

为了定义常见的输出数据格式， Scrapy 提供了 Item 该类。 Item 对象是用于收集抓取数据的简单容器。它们提供了类似于字典的 API ，具有方便的语法来声明其可用字段。

接下来，我们来创建一个 Item 。

创建 Item 需要继承 scrapy.Item 类，并且定义类型为 scrapy.Field 的字段。

在前面一篇文章中，我们的目的想要获取的字段有 text 、 author 、 tags 。

那么，我们定义的 Item 类如下，这里直接修改 items.py 文件：

<code>import
 scrapy

class
 QuoteItem(scrapy.Item):
     
text
 = scrapy.Field()
    author
 = scrapy.Field()
    tags
 = scrapy.Field()
/<code>

接下来就是我们如何要在 first_scrapy 项目中使用这个 Item 了，修改之前的 QuotesSpider 如下：

<code>import scrapy
from
 first_scrapy.items import QuoteItem

class
 QuotesSpider
(scrapy.Spider)
:
    name = 'quotes'
    allowed_domains = ['quotes.toscrape.com']
    start_urls = ['http://quotes.toscrape.com/']

    
def
 parse
(self, response)
:
        quotes = response.css('.quote')
        for
 quote  
in quotes:
            item = QuoteItem()
            item['text'
] = quote.css('.text::text').extract_first()
            item['author'
] = quote.css('.author::text').extract_first()
            item['tags'
] = quote.css('.tags .tag::text').extract()
            yield item
/<code>

接下来，我们可以通过最简单的命令行将我们刚才获取到的数据保存为 json 文件，命令如下：

<code>scrapy crawl quotes
 -o quotes
.json
/<code>

执行后可以看到在当前目录下生成了一个名为 quotes.json 的文件，具体内容如下：

输出格式还支持很多种，例如 csv、xml、pickle、marshal 等，常见的输出语句如下：

<code>scrapy crawl

quotes

-o

quotes

.csv

scrapy crawl

quotes

-o

quotes

.xml

scrapy crawl

quotes

-o

quotes

.pickle

scrapy crawl

quotes

-o

quotes

.marshal

/<code>

直到这里，我们简单的将获取到的数据导出成了 json 文件，这就结束了么？

当然没有，前一篇文章我们只是简单的获取了当前页面的内容，如果我们想抓取后续页面的内容怎么做呢？

当然，第一步我们需要先观察后面一页的链接：http://quotes.toscrape.com/page/2 。

接下来，我们需要构造一个访问下一页的请求，这时我们可以使用 scrapy.Request 。

这里我们使用 Request() 先简单的传入两个参数，实际上可以传入的参数远不止两个，这个我们后面再聊。

url：此请求的URL
callback：它是回调函数。当指定了该回调函数的请求完成之后，获取到响应，引擎会将该响应作为参数传递给这个回调函数。

那么接下来我们要做的就是使用选择器得到下一页链接并生成请求，使用 scrapy.Request 访问此链接，进行新一轮的数据抓取。

添加的代码如下：

<code>next
 = response.css('.pager .next a::attr("href")').extract_first()
url = response.urljoin(next)
yield
 scrapy.Request(url=url, callback=self.parse)
/<code>

现在，改动后的 Spider 类整体代码如下：

<code> 
import scrapy
from
 first_scrapy.items import 
 QuoteItem

class
 QuotesSpider
(scrapy.Spider)
:
    name = 'quotes'
    allowed_domains = ['quotes.toscrape.com']
    start_urls = ['http://quotes.toscrape.com/']

    
def
 parse
(self, response)
:
        quotes = response.css('.quote')
        for
 quote in quotes:
            item = QuoteItem()
            item['text'
] = quote.css('.text::text').extract_first()
            item['author'
] = quote.css('.author::text').extract_first()
            item['tags'
] = quote.css('.tags .tag::text').extract()
            yield item

        next = response.css('.pager .next a::attr("href")').extract_first()
        url = response.urljoin(next)
        yield scrapy.Request(url=url, callback=self.parse)
/<code>

再次使用命令执行这个 Spider ，得到的结果如下（注意，如果前面生成过 json 文件，记得删除后再运行，否则会直接追加写）：

可以看到，数据增加了许多，说明我们抓取后续页面的数据成功。

到这里就结束了么？怎么可能，我们这里只是简单的将数据保存在了 json 文件中，并不方便我们的取用，这里我们可以将数据保存在我们所需要的数据库中。

Item Pipeline

当我们想将数据保存在数据库中时，可以使用 Item Pipeline ，Item Pipeline 为项目管道。

这个管道的典型用途有：

清洗 HTML 数据
验证爬取数据，检查爬取字段
查重并丢弃重复内容
将爬取结果储存到数据库

本示例选择保存的数据为 MongoDB ，接下来，我们会将前面查询出来的数据保存在 MongoDB 中。

emmmmmmmmmm，如果要问小编 MongoDB 怎么安装的话，简单来讲，直接使用 Docker 进行安装，只需几个简单的命令即可：

<code>

docker

pull mongo （拉取镜像默认最新版本）

docker

images （查看镜像）

docker

run -p 27017:27017 -td mongo （启动镜像）

docker

ps （查看启动的镜像）

/<code>

如果不出意外，以上这几句话执行一下就可以了。连接工具可以使用 Navicat 。

这里我们直接修改 pipelines.py 文件，之前使用命令自动生成的内容可以全都删掉，写入以下内容：

<code> 

from
 scrapy.exceptions import DropItem

class
 TextPipeline
(object)
:

    
def
 process_item
(self, item, spider)
:
        if
 item['text']:
            return item
        else:
            return
 DropItem('Missing Text')
/<code>

这里我们实现了 process_item() 方法，其参数是 item 和 spider。

这里简单判断了当前的 text 是否存在，如果不存在则直接抛出 DropItem 异常，如果存在则直接返回 item 。

接下来，我们将处理后的 item 存入 MongoDB，定义另外一个 Pipeline。同样在 pipelines.py 中，我们实现另一个类 MongoPipeline，内容如下所示：

<code>import pymongo

class
 MongoPipeline
(object
):
    
def
 __init__
(
self
, mongo_uri, mongo_db)
:
        self.mongo_uri = mongo_uri
        self.mongo_db = mongo_db

    @classmethod
    
def
 from_crawler
(cls, crawler)
:
        return
 cls(mongo_uri=crawler.settings.get('MONGO_URI'),
                   mongo_db=crawler.settings.get('MONGO_DB')
                   )

    
def
 open_spider
( 
self
, spider)
:
        self
.client = pymongo.MongoClient(self.mongo_uri)
        self
.db = self
.client[self.mongo_db]

    
def
 process_item
(
self
, item, spider)
:
        name = item.__class__
.__name__
        self.db[name].insert(dict(item))
        return item

    
def
 close_spider
(
self
, spider)
:
        self.client.close()
/<code>

MongoPipeline 类实现了 API 定义的另外几个方法。

from_crawler，这是一个类方法，用 @classmethod 标识，是一种依赖注入的方式，方法的参数就是 crawler，通过 crawler 这个我们可以拿到全局配置的每个配置信息，在全局配置 settings.py 中我们可以定义 MONGO_URI 和 MONGO_DB 来指定 MongoDB 连接需要的地址和数据库名称，拿到配置信息之后返回类对象即可。所以这个方法的定义主要是用来获取 settings.py 中的配置的。
open_spider，当 Spider 被开启时，这个方法被调用。在这里主要进行了一些初始化操作。
close_spider，当 Spider 被关闭时，这个方法会调用，在这里将数据库连接关闭。最主要的 process_item() 方法则执行了数据插入操作。

定义好 TextPipeline 和 MongoPipeline 这两个类后，我们需要在 settings.py 中使用它们。MongoDB 的连接信息还需要定义。

在 settings.py 中加入如下内容：

<code>ITEM_PIPELINES = {
    'first_scrapy.pipelines.TextPipeline': 300,
    'first_scrapy.pipelines.MongoPipeline': 400,
}
MONGO_URI='localhost'
MONGO_DB='first_scrapy'
/<code>

再次执行爬取命令：

<code>scrapy crawl quotes
/<code>

执行结果如下：

可以看到，在 MongoDB 中创建了一个 QuoteItem 的表，表中保存了我们刚才抓取到的数据。

示例代码

本系列的所有代码小编都会放在代码管理仓库 Github 和 Gitee 上，方便大家取用。

示例代码-Github

示例代码-Gitee

参考

https://docs.scrapy.org/en/latest/topics/request-response.html

https://docs.scrapy.org/en/latest/topics/items.html

https://cuiqingcai.com/8337.html

分享到:

關鍵字: 表中 Item self

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

记者从河北省公安厅获悉，日前公安部通缉的13名A级通缉犯中的2号通缉犯鲁某某近日向河北邯郸警方投案自首，这是公安部A级通缉令后又一通缉犯主动投案。

当我们在谈 SaaS 的时候，在谈什么？

当我们在谈SaaS 的时候，在谈什么？什么是 SaaSSaaS 优缺点SaaS 销售模式SaaS 产品指标SaaS 业务指标SaaS 收入计算一、什么是 SaaS这个模式让软件变得和水电气很相似，只需要每月缴纳固定的费用即可享受服务。

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

现阶段，随着国家供给侧结构性改革的不断深入，人们在市场中的互易行为日益频繁，合同在经济活动发挥的作用也日渐凸显。

5月西安招聘会时间安排来了！找工作的别错过

乘车路线:西安市内乘坐12路、14路、14路区间、26路、215路、215路区间、216路、224路、229路、239路、31路、36路、321路、323路、521路、600路、603路、616路、701路、704路、709路、教育专线、K605路、K616路、游6路、游8路61

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

刚刚:刚刚工作的毕业生，一个月只有2000多，是不是太少了？根据你城市消费水平来看啊，还有你从事的工作，假如你在二三线城市做一份事业单位或者是编制类的工作，薪资水平是随着你工作年限逐年增长的，而且在年终也有很多福利补贴待遇等等，算下来收入也是可观的，再举一个例:-毕业生 2000

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

基于以太坊区块链的主要稳定币包括：Tether、TrueUSD、GeminiDollar、Paxos Standard、Binance USD、USD Coin、Huobi USD和MakerDAO等。

“帮助当地居民解决用水难题”-今日头条-手机光明网

晨曦初露，9岁的米格尔和弟弟妹妹们抱着水罐，穿过一片田野，到达安哥拉首都罗安达郊区的指定取水点。葛洲坝安哥拉有限公司市场部负责人刘世轩介绍说，公司每天派出送水车两次，一次3车，将洁净水从罗安达水厂直接运往指定取水点。

灌篮高手无水印壁纸，每一张都是回忆

那些年，我们追过的灌篮高手，你更喜欢谁呢？流川枫樱木花道赤木刚宪宫城良田三井寿你喜欢哪个球员呢？欢迎评论区留言。

通辽蓝天救援队成功解救辽河公园水上被困群众

2020年5月1日，通辽蓝天救援队假期例行在辽河公园水域进行安全巡逻任务，下午15时10分，巡逻队员发现辽河水面有被困群众向巡逻船只求救，接到求救信号后，巡逻队员紧急前往事故现场展开研判、救援准备工作。

5月6日·武汉要闻及抗击肺炎快报

今天零时起高速公路恢复收费了，这些车辆还能免费5月6日零时起全国高速公路恢复收费在武汉北收费站ETC和人工车道全部可通行零时左右通过收费站的车辆并不多以大货车为主有工作人员在一旁引导货车进入高速收费站前要通过入口称重检测车道进入没有超重超限便可顺利通过现场没有出现排队的现象全省联

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

2020年4月29日下午，肖副省长等省市领导来到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作，肖副省长等省市领导在学校领导陪同下，重点对校门口出入、保健室、教室、学生心理辅导室、洗手池等进行了非常细致的检查，对孝感市楚澴中学的复学和疫情防控工作给予充分的肯定。

相声界的颜值担当张云雷称号大揭秘

这个播放量就连师傅身为相声演员的张云雷却有着堪比娱乐圈小鲜肉的颜值，一个相声演员长成这样，张云雷不火谁能火。

美国百年薅羊毛攻略

当德国向法军阵地倾泄400多万发炮弹，扬言要让凡尔登成为「碾碎法军的绞肉机」时，远在大西洋的美国人。

《全职高手》：一口气刷了10集，对杨洋路转粉了

近日，由杨洋、江疏影主演的剧版《全职高手》在腾讯视频正式开播了，该剧改编自蝴蝶蓝同名小说，先前还被改编成动画版。

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

前言：IG这只老牌战队在我们LPL赛区以来都拥有着非常高的人气，特别是在2018年之后，他们帮助我们LPL赛区夺得了第一个宝贵的S赛世界冠军，而IG战队的打法一直以来也是非常有观赏性的。

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

Doinb表示："可以的话我不想参加，首先这场比赛没有任何意义，获得胜利既不会有奖金也不会有荣誉，但万一输掉比赛FPX就会成为大家吐槽的焦点"。

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

大家都知道天后王菲和前夫李亚鹏他们育有一个女儿，名叫李嫣。于是李嫣因为偷偷的开了直播从而也导致了她被大家所发现，但李嫣的乐观和开朗却也让李亚鹏放下心来，决定放飞女儿，让她自由的去探索她想要的世界。

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

天王郭富城近日参加活动，首度承认妻子方媛怀有二胎的消息。从去年2017年两人结婚，低调的爱情让媒体都捕捉不到边际，天王嫂31岁两人相差了20岁的爱恋，始终不少人不看好啊。

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

演员在我们眼中一直都是光鲜亮丽、收入颇高的职业，并且现在有很多靠流量跻身一线，却毫无演技以及实力的演员。

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

曾经贾乃亮是“阳光”的代名词，大家看到他都觉得很暖，只不过后来就不是了。今天早上，他发了一条微博“人生的美好就是每天醒来都能看到上帝赐予我的那一米阳光”，这句话当中，贾乃亮用到了“一米阳光”这个词。

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

当一名理发师也不容易这是一只有航天梦想的老鼠宝宝！什么？这么贵！把我卖了得了。小朋友，你赢了，我甘拜下风！

为什么只有edg赚钱？

电竞行业作为一个新兴产业，这几年发展势头越来越好，IG战队，FPX战队先后夺得了s8-s9世界赛的冠军，据俱乐部知情人士透露，除了国内的几家豪门俱乐部之外，其他俱乐部基本都是亏钱在做的，当然EDG也是:-edg 赚钱:为什么只有edg赚钱？

程潇身材多好？双腿劈叉才明白，这才是“腿精”

程潇可谓是才女，她是中韩宇宙少女的成员之一，今年她只有20岁。不要看程潇年纪比较小，但是她身材还是挺好的，身材也是典型S型曲线，魅力不小。

张柏芝承认三胎产子，否认小伙的老爸是孙东海，看来她选择保密

张柏芝是许多80后90后心目中的女神，除了颜值高有演技外，她和谢霆锋的婚姻和恋情也曾是吃瓜群众津津乐道的事。

T1战队抢注Faker商标，“囊括多个领域产品，商业潜力媲美乔丹”

前言：目前各大赛区的春季赛都已经结束了，T1战队在重组之后再度拿下了lck赛区的冠军，这让很多的玩家非常意外，这也从侧面反映出来了，核心选手和主教练的个人能力，同时faker的实力再度被玩家们认可，最近一段时间他也是一直在直播，很多的人都在询问，今年李哥的目标是什么？

云顶之弈“最不平衡的版本”诞生，全员抢一费卡，运气成吃鸡关键

上线之后迅速引发了大量玩家的好评，就在最近，官方也是迎来了10.9版本，可是在目前的版本中再度出现了太多的畸形玩法了，应该是有史以来最不平衡的版本，因为一费卡的爆率大大提升，导致游戏成为了三星的天下，全员抢一费卡，运气成为吃鸡的关键。

LPL春季赛"6宗最"：Uzi最遗憾，阿水最惊喜，V5最离谱

在本期节目中会评选出一位最美丽LPL女解说，其中瞳夕、Rita、余霜等都在名单之中，最有趣的是管泽元居然也出现在了“女解说”名单中，全因余霜一张P过的照片，论梗的话，管泽元第一，若是轮颜值，估计这也排不上名次。

雷佳音被问：跟佟丽娅拍那么多亲热戏是啥感受？他的回答笑翻众人

不过要是像唐嫣和罗晋那样用公费谈恋爱的故事不多，大多数还是和不是心爱的人拍得多，但要是遇上岳云鹏和佟丽娅拍亲热戏的话，那个画面或许大家想象不出来吧。

JDG成最“惨”冠军战队？拿到LPL冠军人气依旧低迷，TES成赢家！

LPL赛区的春季赛结束也有一段时间了，作为冠军战队JDG，并没有因为拿到冠军而出现“人气”的高涨，依旧平平淡淡，熟悉LPL赛区的玩家都知道，在LPL赛区中，一直以来都是由RNG、IG、EDG三家从“远古”时期就开始统治LPL赛区，期间也有OMG和LGD、WE几个战队打破了这个规律

#战疫必胜#“症和状”都有了，我与新冠擦肩而过

学习结束，回到家后，在武大短暂学习的那段时光时常让我怀念，并曾立下誓言，抽个暑假一定要带着老婆孩子一起去“逛”武大。机会就这么悄然而至！2019年第28届世界脑力锦标赛全球总决赛的举办地就是武汉，比赛的日期是12月6日到8日，三天的时间。其实，我也没有想到第一次参加这样比赛的女儿

T1提议中韩友谊赛，但LPL队伍都不想参加？理由其实很简单

这不今天就有网友在论坛中聊起了这个话题，有网友表示“LPL队伍其实都不想参加中韩友谊赛，LPL队伍才刚结束春季赛，18天之后就要打夏季赛了，像IG可能会有人员变动FPX TES 应该也会利用这段时间来检讨分析，也许只有JDG 比较愿意参加，doinb只是第一表态的选手，可能还有很

网友投稿：光山县泼陂河镇至白雀园镇的X015县道德两座坏桥经过5个月的等待终于开修啦#光山 #信阳

网友投稿：光山县泼陂河镇至白雀园镇的X015县道德两座坏桥经过5个月的等待终于开修啦#光山 #信阳，于2020年04月28日上线，由信阳本地联盟上传。西瓜视频为您提供高清视频，画面清晰、播放流畅，看丰富、高质量视频就上西瓜视频。

2020最佳韩剧追起来~《爱的迫降》仅排名第二，TOP 1绝对实至名归

TOP20 - 「优雅的家」这部由林秀香、李章宇、裴宗玉等人所主演的《优雅的家》，当时一播出就引起不少话题，虽然剧情有点浮夸，但却莫名好看，而当时该剧还刷新了MBN电视台的记录呢~《优雅的家》主要讲述一位拥有完美外貌和身材的MC集团独生女毛硕熙，为了查明15年母亲去世的真相，因此

搞笑GIF开心一刻：我正在睡觉，谁敢打扰我

我这暴脾气，等你剥完我能吃五个你带着你家猫去做演员吧！这猫太有前途了！这是我见过最牛的啦啦队！自从有了弟弟，老大就和家务结缘了狼狗：要不是主人在，我非吃了你两个小子！

备考消防的几大错觉，你有这个情况吗？

讲真，很多时候我们会把事情想当然，并因为这些错觉而采取错误的举动，一消备考是一场毅力和心智的战斗，大家难免会产生一些错觉，从而影响自己的备考效率，甚至导致备考失败。

“顶流”李敏镐哑火，渣男出轨剧出圈，韩剧观众也长大了？

豆瓣开分8.3，渐渐跌到7.7分，热门短评写道：“同样是金编，差距怎么这么大”、“看了四集节奏真的是一团糟，比起隔壁《夫妻的世界》真的差一大截”。

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

20000:网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？天猫旗舰店，或者淘宝旗舰店，或者京东旗舰店肯定包真，质量好，再说可以官方验证啊，不能图那十块五块的便宜，毕竟一个充电宝要用好久呢，一两年没问题的。:-罗马仕马仕毫安

应急科普丨“五一” 期间气温回升谨防森林火灾隐患

随着“五一”期间气温大幅回升全国大部分地区已经进入初夏在享受小长假春日美景的同时森林火险等级也随之明显提升新疆森林消防提示您春季气温回升快野外草木干燥你的一个失当用火行为就有可能引发森林大火勿念葱林繁似海一星燃尽只尘埃

搞笑GIF开心一刻：拍照啦，赶紧看镜头

弟弟：姐姐你能利索点吗家里有个熊孩子，说实话心很累同学感觉你好可伶，一个人跳舞多尴尬啊！看我病好了怎么收拾你们！真的是以迅雷不及掩耳之势啊。姑凉，你……掉毛啊！小姐姐你是想找男朋友吗用这样的方式，结局很意外此处注意安全！

工程发承包、工程造价条款，或迎来大调整

第二章建设规划与设计第一节建设规划第八条建设规划的体系第九条建设规划的编制与审批第十条建设规划的内容第十一条建设规划的实施与评估第二节城市设计第十二条城市设计的基本要求第十三条城市设计的编制和审批第十四条城市设计的实施和管理第三节建筑设计第十五条建筑设计的基

新增四省！关于2019年一级建造师考试证书、复核发布公告

快来看看吧~青海关于恢复专业技术人员职业资格证书的发放、补办工作的通知各位考生：随着疫情防控进入常态化，青海省新冠疫情得到有效控制，专业技术人员职业资格证书的印制、发放工作正在逐步恢复，为方便广大考生办理证书业务，4月28日起青海省人力资源和社会保障服务中心一楼大厅65、66号办

学霸也会复读？朱广权这个圈粉无数的国民段子手是如何炼成的！

“烟笼寒水月笼沙，不止东湖与樱花，门前风景雨来佳，莲藕鱼糕玉露茶，凤爪藕带热干面，米酒香菇小龙虾，守住金莲不自夸，赶紧下单买回家，买它买它就买它，热干面和小龙虾。”

幸福的人，总会忘记旧爱

幸福从来不可能是有个人帮你搞定所有的一切，而你只需要坐享其成。她喜欢喝银耳莲子羹而且必须是上好的银耳，用小火慢慢炖到砧稠那一日，他去看她，她冷冷地从屋里走出来，丢给他一本书.对他说:"厨房里小锅炖着东西，你帮我去看看。”他真真地守了一个多小时，端到她面前。

真人芭比：一直说自己“没整容”最后晒出旧照，打脸的却是自己

俗话说的好“爱美之心人人都有”而让自己快速变美的方法无疑就是“整容”如今的社会整容看起来似乎很平常。

惊了！这件事没有做，一消证书等于白考！

不要慌，同学们，遇到问题不要怕，拿到证书不去注册，相当于证书无效，今天就为大家一一解答注册证书的相关问题。

8年后，有哪些人会留在农村生活？以下4类人群或将留下，有你吗

从九十年代末开始，在我国农村地区就兴起了一股“进城潮”，记得那个时候，农村的经济发展相对滞后，村民生活条件艰苦，乡亲们为了摆脱贫困，只能告别亲人，远离家乡去外面打拼赚钱。

唯一回绝张艺谋力捧的女生，被报送上清华，25岁有上百亿身家

25岁有上百亿身家文/娱乐深扒爆姐图/网络张艺谋是一位非常有实力的导演，同时非常出名，而且他拍摄的作品中有不少获奖无数的经典影片，同时也捧红过不少艺人。

疫情下的悲剧：买不起手机上网课，那个女孩决定吞药自杀

有人为了生计不顾自身安危，有人躲在家中安然度日，还有人仅仅因为一个手机，就要放弃自己的生命...这个女孩，今年上初三，因为疫情的原因，全国各地都展开了网课线上教育，女孩的学校也不例外。

李栋旭刘仁娜新剧开拍，互对台词欢乐多，终于要开始撒狗粮了吗？

这部剧是2016年年底播出的，热度一直持续到了2017年，相关的周边和景点都相当热门，像是池恩卓跟鬼怪大叔相遇的海边、剧中出现的鬼怪玩偶、还有鬼怪大叔的拔剑特效等等。

高考延期：七月的高考，最热的天，做最难的题！

后来，由于7月份气候较差，极端天气频发，尤其是南方地区，要么极端高温，要么就是台风，对于高考来说非常不友好，不仅考生的考试质量会下降，而且阅卷老师、高考工作者也不方便，因此，从2003年开始，高考日期都固定在了每年的6月7日、8日。

小白学 Python 爬虫（34）：爬虫框架 Scrapy 入门基础（二）

引言

Item

Item Pipeline

示例代码

参考

相關文章:

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

当我们在谈 SaaS 的时候，在谈什么？

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

5月西安招聘会时间安排来了！找工作的别错过

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

“帮助当地居民解决用水难题”-今日头条-手机光明网

灌篮高手无水印壁纸，每一张都是回忆

通辽蓝天救援队成功解救辽河公园水上被困群众

5月6日·武汉要闻及抗击肺炎快报

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

相声界的颜值担当张云雷称号大揭秘

美国百年薅羊毛攻略

《全职高手》：一口气刷了10集，对杨洋路转粉了

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

为什么只有edg赚钱？

程潇身材多好？双腿劈叉才明白，这才是“腿精”

张柏芝承认三胎产子，否认小伙的老爸是孙东海，看来她选择保密

T1战队抢注Faker商标，“囊括多个领域产品，商业潜力媲美乔丹”

云顶之弈“最不平衡的版本”诞生，全员抢一费卡，运气成吃鸡关键

LPL春季赛"6宗最"：Uzi最遗憾，阿水最惊喜，V5最离谱

雷佳音被问：跟佟丽娅拍那么多亲热戏是啥感受？他的回答笑翻众人

JDG成最“惨”冠军战队？拿到LPL冠军人气依旧低迷，TES成赢家！

#战疫必胜#“症和状”都有了，我与新冠擦肩而过

T1提议中韩友谊赛，但LPL队伍都不想参加？理由其实很简单

网友投稿：光山县泼陂河镇至白雀园镇的X015县道德两座坏桥经过5个月的等待终于开修啦#光山 #信阳

2020最佳韩剧追起来~《爱的迫降》仅排名第二，TOP 1绝对实至名归

搞笑GIF开心一刻：我正在睡觉，谁敢打扰我

备考消防的几大错觉，你有这个情况吗？

“顶流”李敏镐哑火，渣男出轨剧出圈，韩剧观众也长大了？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

应急科普丨“五一” 期间气温回升 谨防森林火灾隐患

搞笑GIF开心一刻：拍照啦，赶紧看镜头

工程发承包、工程造价条款，或迎来大调整

新增四省！关于2019年一级建造师考试证书、复核发布公告

学霸也会复读？朱广权这个圈粉无数的国民段子手是如何炼成的！

幸福的人，总会忘记旧爱

真人芭比：一直说自己“没整容”最后晒出旧照，打脸的却是自己

惊了！这件事没有做，一消证书等于白考！

8年后，有哪些人会留在农村生活？以下4类人群或将留下，有你吗

唯一回绝张艺谋力捧的女生，被报送上清华，25岁有上百亿身家

疫情下的悲剧：买不起手机上网课，那个女孩决定吞药自杀

李栋旭刘仁娜新剧开拍，互对台词欢乐多，终于要开始撒狗粮了吗？

高考延期：七月的高考，最热的天，做最难的题！

应急科普丨“五一” 期间气温回升谨防森林火灾隐患