scrapy架構分析

scrapy是Python的高級爬蟲框架,可以實現分佈式異步爬取,是5+2結構,由Scrapy Engine(引擎)+Scheduler(調度器)+Downloader(下載器)+Spider(爬蟲)+Item Pipeline(管道)+Downloader Middlewares(下載中間件)+Spider Middlewares(爬蟲中間件) 組成,詳細工作流程如下圖所示:

scrapy架構分析

每個組件的功能如下圖所示:

scrapy架構分析


分享到:


相關文章: