「python」网页爬虫思路

1、Request获取网页内容

2、使用BeautifulSoup解析网页

3、soup.select获取需要的所有数据

4、for循环在zip数据,得到需要的内容

————————————————————

5、如果有反爬虫,尝试写入header头,用手机页面

6、for循环和构造页面page,连续爬多个页面

—————————————————————

您对以上的内容,哪一部分不了解,请尝试搜索一下。

「python」网页爬虫思路


分享到:


相關文章: