前不久用python寫了一款超級URL採集器，不敢獨享，分享給大夥！技术頭條網

前不久用Python寫了一款超級URL採集程序，自己用了發現效果不錯。並且網上很多采集工具不但失效，而且還基本只能採集單一搜索引擎的，不敢獨享，分享給大夥。

軟件簡介：（私信小編007即可獲取大量Python學習資源，包含PDF以及視頻教程）

根據關鍵詞，支持同時對多個搜索引擎內容檢索結果的網址內容進行URL採集與過濾(支持中文)。

程序主要運用於安全滲透測試項目，以及批量評估各類CMS系統0DAY的影響程度，同時也是批量採集自己獲取感興趣的網站的一個小程序~~

可自動從搜索引擎採集相關網站的真實地址與標題等信息，可保存為文件，自動去除重複URL。同時，也可以自定義忽略多條域名。

可以忽略不需要的常見網站，如忽略百度翻譯，等等所有百度相關結果，給數組添加baidu.com即可。程序已經默認忽略了很多條，也支持根據自己的需求進行自定義。如
filter_array1 = ['baidu.com','sina.com.cn','sohu.com','taobao.com','douban.com','163.com','tianya.cn','qq.com','1688.com']
filter_array2 = ['ganji.com','58.com','baixing.com']
filter_array3 = ['zhihu.com','weibo.com','iqiyi.com','kugou.com','51.com','youku.com','soku.com','acfun.cn','verycd.com']
filter_array4 = ['google.cn','youdao.com','iciba.com','cdict.net']
filter_array5 = ['pconline.com.cn','zcool.com.cn','csdn.net','lofter.com']
實時顯示採集到的網頁的【真實URL】以及【標題】。前面的【ID】對應的是當前頁百度結果的第X條數據
可以自定義採集返回的是詳細URL，或者只採集返回域名
自動保存結果到當前目錄的txt文件，文件名為搜索的關鍵詞.txt
為了方便導入到其他工具，txt文件裡面只記錄了採集的網址。當然也可以自定義加入。如果需要同時記錄標題，把代碼中的註釋刪除即可
自動去除重複記錄
統計總採集條數（143 found），有效的條數（91 checked），被過濾的條數（52 filter），以及被過濾的重複的URL條數（9 delete）