只需1分鐘，就可以爬取高德地圖1個地市900個景區名稱地址_ _ 頭條網

需要的庫：

selenium：自動化操作瀏覽器

beautifulsoup:提取數據

安裝方式：pip

需要注意的是：selenium需要安裝對應的瀏覽器的驅動：

Chrome

下載chrome的webdriver： http://chromedriver.storage.googleapis.com/index.html

Firefox

Firefox驅動下載地址為：https://github.com/mozilla/geckodriver/releases/

IE瀏覽器驅動下載地址為：http://selenium-release.storage.googleapis.com/index.html

根據自己selenium版本下載對應版本的驅動即可

下載後：如果是windows賦值驅動到瀏覽器的安裝目錄即可

思路：通過selenium打開瀏覽器，在搜索框輸入景區，然後就可以看到一個彈出的下拉框，每頁有20個景區，一共有40多頁，就需要提取每頁的景區名稱和地址，然後點擊下一頁再繼續提取，最後保存到文件中：

開始：

打開jupyter:

第一步：導入需要的庫：

from bs4 import BeautifulSoup from selenium import webdriver import time import pandas as pd

第二步：通過selenium打開瀏覽器，搜索

driver = webdriver.Firefox() driver.maximize_window() driver.get("https://www.amap.com/") elem = driver.find_element_by_xpath('//*[@id="searchipt"]') elem.send_keys("景區") elem = driver.find_element_by_xpath('/html/body/section[1]/header/div[2]/div/i') elem.click()

第三步：通過beautifulsoup獲取網頁源代碼，並提取需要的內容，並通過selenium重複點擊下一頁，重複提取至字典中：

dict = {} dict2 = {} for i in range(47): print(i) soup = BeautifulSoup(driver.page_source) for na, ad in zip(soup.select(".poi-name"), soup.select(".poi-addr")): print(na.string) dict[''.join(na.string.split())] = ad.string elem = driver.find_element_by_xpath( "/html/body/div[1]/section/section/div[2]/span[1]/i") elem.click() time.sleep(10)

第四步：導入到pandas中，導出至文件或者剪貼板：

data=pd.DataFrame.from_dict(dict,orient='index') data.reset_index(inplace=True) data.columns=["名稱","地址"] data.to_clipboard() data

結果：

相關文章:

50ETF期權行情與策略分析（2019.12.3）

爬蟲代理有哪些類型呢-蘋果ip

高德地圖用新思路破局“打車難”

python使用併發法爬取二手房數據，速度提升不止十倍

項目實戰一：python爬取安居客各地（此例為福州）二手房數據信息

Python爬蟲學習教程 bilibili網站視頻爬取！【附源碼】

我用python找到了室友的初戀

一個APP能叫多種網約車：聚合模式深入人心 遇到問題卻投訴無門

“高德地圖”和“百度地圖”之間的區別是什麼？網友：細節定成敗

Python百行代碼輕鬆爬取了妹子網100G的套圖，希望你網盤內存夠用

馬雲談網約車：政府只要關心人民的生命安全就行！

我同事，3分鐘，100張圖，真的不是人

900匹馬力，最奢華的地表火箭！

迪卡儂Van Rysel RR 900 AF

多線程爬蟲其實很簡單，只用十個線程每天即可爬取100萬條數據

威爾聖2019年淨利302.58萬較上年同期下滑30.28% 成本提高

中國能建一季度新籤電力工程合同900.35億元

請查收，一份讓你年薪突破20W的Python爬蟲筆記！

python《青春有你2》練習生照片爬取

今年一季度中國十大堵城排行榜

高德公佈全國最新十大堵點，北京這段路“勇奪” 第一

Web黑客近年神作Gospider：一款基於Go語言開發的Web爬蟲，要收藏

如何爬取鏈家真實成交價格並做分析

Web Scraper 使用教程（二）- 基本用法（啟動、配置、運行）

機械部落：雅馬哈TRACE 900 VS 鈴木V-Strom 650

全面突破價值極限！長安歐尚X5春城激情開跑

高德打車聯合AutoX啟動無人駕駛網約車，上海招募免費體驗用戶

擁堵全國第7降到第39位，阿里雲高德螞蟻攜手武漢治堵

賣出同德轉債獲利1320.52元

高德地圖和百度地圖合體了？-好軟推薦

Python爬蟲 ---scrapy框架初探及實戰！

使用requests爬取拉勾網python職位數據

Python爬蟲自學筆記：爬取小說（四）

兼職平臺：高德淘金的累與淚！

城市道路恢復擁堵，看看北京排第幾？

國人驕傲 華為推出比世界紀錄快10秒的 AI訓練集群Atlas 900

PR預設模板-900+文字標題場景片頭視頻調色轉場特效包裝工具包

送給土豪們的禮物，全球限量10臺的巴博斯Rocket 900

"老年人"不配看青你2和創造營？我爬了微博數據結果發現…

美團打車悄然轉身 聚合模式劍指平臺​

百度地圖迴應“抄襲高德”事件：不承認 信息來自當地交警

2020.4.26日-全國各地 明天毛鴨、鴨苗、鴨蛋價格

華為逆天，給蘋果一記重擊，蘋果還能在中國佔有市場嗎？

高德地圖打卡5天瓜分百萬大獎 戚薇鄧倫等明星幫驗證

支付寶小程序打通UC、高德，發力場景流量池

滴滴上線網約車開放平臺 與美團、哈囉、高德“正面剛”

八菱科技預計2020年一季度虧損900.0萬至1500.0萬

車載導航CE版之美行（高德）Z19+Z22雜交方法

凱立德一個落寞的貴族！說下凱高百三者使用後的感受！

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

一個APP能叫多種網約車：聚合模式深入人心遇到問題卻投訴無門

國人驕傲華為推出比世界紀錄快10秒的 AI訓練集群Atlas 900

美團打車悄然轉身聚合模式劍指平臺

百度地圖迴應“抄襲高德”事件：不承認信息來自當地交警

2020.4.26日-全國各地明天毛鴨、鴨苗、鴨蛋價格

高德地圖打卡5天瓜分百萬大獎戚薇鄧倫等明星幫驗證

滴滴上線網約車開放平臺與美團、哈囉、高德“正面剛”

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患