AI+開源十三:批量下載圖片利器-Image Downloader

1. 簡介

  • 從圖片搜索引擎,爬取關鍵字搜索的原圖URL並下載
  • 開發語言python,採用Requests、Selenium、Phantomjs等庫進行開發

2. 功能

  • 支持的搜索引擎: Google, 必應, 百度
  • 提供GUI及CMD版本
  • GUI版本支持關鍵詞鍵入,以及通過關鍵詞列表文件(行分隔,使用UTF-8編碼)輸入進行批處理爬圖下載
  • 可配置線程數進行併發下載,提高下載速度
  • 支持搜索引擎的條件查詢(如 :site)
  • 支持Google的安全模式開啟和關閉
  • 支持socks5和http代理的配置,方便科學上網用戶
  • 提供預編譯的windows單文件可執行exe下載, 推薦非開發者用戶使用。點此下載

3. 解決依賴

3.1 Windows環境

3.1.1 下載並安裝python3.5

  • 下載地址
  • 安裝時請注意勾選"add to PATH"

3.1.2 下載並安裝PyQt5

  • 下載地址

3.1.3 下載phantomjs並配置

  • 下載地址
  • 選擇最新的windows版本下載即可
  • 下載完成後將phantomjs.exe拷貝到 "本項目文件夾/bin/"

3.1.4 安裝相關python庫

<code>pip3.exe install -r requirements.txt
/<code>

3.1.5 [可選] 打包成單個可執行文件

確保 3.1.3 步驟完成後,CMD進到項目文件夾,執行如下命令:

<code>pip3.exe install pyinstaller
pyinstaller image_downloader_gui.spec
/<code>

命令完成後,exe文件在 ./dist 文件夾中

3.2 Linux環境(debian系列)

3.2.1 安裝依賴庫

<code>apt-get install python3-pip python3-pyqt5 pyqt5-dev-tools
/<code>

3.2.2 下載Phantomjs並配置

  • x86 PC用戶下載地址 (官方)
  • 樹莓派用戶下載地址(無官方版本,第三方通過源碼編譯)

[警告]: 通過apt-get安裝的phantomjs為非完整版,無法在本項目中使用.

下載完成後,將phantomjs文件路徑添加至PATH環境變量,或者將其拷貝到/usr/local/bin文件夾。

4. 如何使用

4.1 圖形界面


AI+開源十三:批量下載圖片利器-Image Downloader


4.2 命令行

<code>usage: image_downloader.py [-h] [--engine {Google,Bing,Baidu}]
[--max-number MAX_NUMBER]
[--num-threads NUM_THREADS] [--timeout TIMEOUT]
[--output OUTPUT] [--safe-mode] [--face-only]
[--proxy_http PROXY_HTTP]
[--proxy_socks5 PROXY_SOCKS5]
keywords/<code>


分享到:


相關文章: