1. 簡介
- 從圖片搜索引擎,爬取關鍵字搜索的原圖URL並下載
- 開發語言python,採用Requests、Selenium、Phantomjs等庫進行開發
2. 功能
- 支持的搜索引擎: Google, 必應, 百度
- 提供GUI及CMD版本
- GUI版本支持關鍵詞鍵入,以及通過關鍵詞列表文件(行分隔,使用UTF-8編碼)輸入進行批處理爬圖下載
- 可配置線程數進行併發下載,提高下載速度
- 支持搜索引擎的條件查詢(如 :site)
- 支持Google的安全模式開啟和關閉
- 支持socks5和http代理的配置,方便科學上網用戶
- 提供預編譯的windows單文件可執行exe下載, 推薦非開發者用戶使用。點此下載
3. 解決依賴
3.1 Windows環境
3.1.1 下載並安裝python3.5
- 下載地址
- 安裝時請注意勾選"add to PATH"
3.1.2 下載並安裝PyQt5
- 下載地址
3.1.3 下載phantomjs並配置
- 下載地址
- 選擇最新的windows版本下載即可
- 下載完成後將phantomjs.exe拷貝到 "本項目文件夾/bin/"
3.1.4 安裝相關python庫
<code>pip3.exe install -r requirements.txt
/<code>
3.1.5 [可選] 打包成單個可執行文件
確保 3.1.3 步驟完成後,CMD進到項目文件夾,執行如下命令:
<code>pip3.exe install pyinstaller
pyinstaller image_downloader_gui.spec
/<code>
命令完成後,exe文件在 ./dist 文件夾中
3.2 Linux環境(debian系列)
3.2.1 安裝依賴庫
<code>apt-get install python3-pip python3-pyqt5 pyqt5-dev-tools
/<code>
3.2.2 下載Phantomjs並配置
- x86 PC用戶下載地址 (官方)
- 樹莓派用戶下載地址(無官方版本,第三方通過源碼編譯)
[警告]: 通過apt-get安裝的phantomjs為非完整版,無法在本項目中使用.
下載完成後,將phantomjs文件路徑添加至PATH環境變量,或者將其拷貝到/usr/local/bin文件夾。
4. 如何使用
4.1 圖形界面
4.2 命令行
<code>usage: image_downloader.py [-h] [--engine {Google,Bing,Baidu}]
[--max-number MAX_NUMBER]
[--num-threads NUM_THREADS] [--timeout TIMEOUT]
[--output OUTPUT] [--safe-mode] [--face-only]
[--proxy_http PROXY_HTTP]
[--proxy_socks5 PROXY_SOCKS5]
keywords/<code>
閱讀更多 人工智能時報 的文章