如何利用python爬取抖音高顏值美女

如何利用python爬取抖音高顏值美女

目標場景

相信大家平時刷抖音短視頻的時候,看到顏值高的小姐姐,都有隨手點贊關注的習慣。

如果一條條去刷確實很耗時間,如果 Python 能幫忙篩選出顏值高的小姐姐那就省了很多事。

本篇文章是藉助「百度人臉識別」API,幫我們識別出抖音上顏值高的小姐姐,然後下載到手機相冊中。

如何利用python爬取抖音高顏值美女

準 備 工 作

首先,項目需要對頁面元素進行一些精準的操作,需要提前準備一部 Android 設備,激活開發者選項,並在開發者選項中打開 「USB 調試和指針位置」兩處設置。

為了確保 ad b 命令能正常使用,需要提前配置好 ad b 開發環境。

頁面元素中的部分元素沒法利用 name 等常用屬性獲取到,可能需要獲取到完整的「U I 樹」,再利用 Air test 判斷是否存在某個 U I 元素。

<code># 安裝依賴pip3installpocoui
/<code>

另外,項目中會對視頻進行人臉識別,獲取到出現的所有人臉,再進行性別識別及顏值判斷。

這裡需要進行百度雲後臺,註冊一個人臉識別的應用,獲取到一組 「API Key 和 Secret Key」值。

<code>http://console.bce.baidu.com/<code>
如何利用python爬取抖音高顏值美女

然後利用官網提供的 API 文檔即可獲取到「access token」,由於 a k 的有效期為一個月,所以只需要初始化一次,後面就可以利用人臉識別接口進行正常的識別了。

<code>appid='你註冊應用的appid'
api_key='你註冊應用的ak'
secret_key='你註冊應用的sk'

defget_access_token():
"""
其關access_token有效期一般有一個月
"""
#此變量賦值成自己APIKey的值
client_id=api_key

#此變量賦值成自己SecretKey的值
client_secret=secret_key

auth_url='http://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id='+client_id+'&client_secret='+client_secret

header_dict={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Trident/7.0;rv:11.0)likeGecko',
"Content-Type":"application/json"}

#請求獲取到token的接口
response_at=requests.get(auth_url,headers=header_dict)
json_result=json.loads(response_at.text)
access_token=json_result['access_token']
returnaccess_token
/<code>

編 寫 腳 本

在上面已經配置好了 a db 環境的情況下,可以直接藉助 python 中的 o s 模塊執行 ad b 命令打開抖音 App。

<code>#抖音App的應用包名和初始Activity
package_name='com.ss.android.ugc.aweme'
activity_name='com.ss.android.ugc.aweme.splash.SplashActivity'

defstart_my_app(package_name,activity_name):
"""
打開應用
adbshellamstart-ncom.tencent.mm/.ui.LauncherUI
:parampackage_name:
:return:
"""
os.popen('adbshellamstart-n%s/%s'%(package_name,activity_name))
/<code>

接著,我們需要截取當前播放視頻的截圖到本地。

如何利用python爬取抖音高顏值美女

需要注意的是,抖音視頻播放界面包含視頻創作者頭像、B G M 創作者頭像等一些雜亂的元素,可能對人臉識別的結果產生一些誤差,所以需要對屏幕截圖之後的圖像進行「二次裁剪」處理。

<code>defget_screen_shot_part_img(image_name):
"""
獲取手機截圖的部分內容
:return:
"""
#截圖
os.system("adbshell/system/bin/screencap-p/sdcard/screenshot.jpg")
os.system("adbpull/sdcard/screenshot.jpg%s"%image_name)

#打開圖片
img=Image.open(image_name).convert('RGB')

#圖片的原寬、高(1080*2160)
w,h=img.size

#截取部分,去掉其頭像、其他內容雜亂元素
img=img.crop((0,0,900,1500))

img.thumbnail((int(w/1.5),int(h/1.5)))

#保存到本地
img.save(image_name)

returnimage_name
/<code>

現在可以使用百度提供的 API 獲取到上面截圖的人臉列表。

<code>defparse_face_pic(pic_url,pic_type,access_token):
"""
人臉識別
5秒之內
:parampic_url:

:parampic_type:
:paramaccess_token:
:return:
"""
url_fi='http://aip.baidubce.com/rest/2.0/face/v3/detect?access_token='+access_token

#調用identify_faces,獲取人臉列表
json_faces=identify_faces(pic_url,pic_type,url_fi)

ifnotjson_faces:
print('未識別到人臉')
returnNone
else:
#返回所有的人臉
returnjson_faces
/<code>

從上述的人臉列表中篩選出性別為女,年齡為 18-30 歲之間,顏值超過 70 的小姐姐。

<code>defanalysis_face(face_list):
"""
分析人臉,判斷顏值是否達標
18-30之間,女,顏值大於80
:paramface_list:識別的臉的列表
:return:
"""
#是否能找到高顏值的美女
find_belle=False
ifface_list:
print('一共識別到%d張人臉,下面開始識別是否有美女~'%len(face_list))
forfaceinface_list:
#判斷是男、女
ifface['gender']['type']=='female':
age=face['age']
beauty=face['beauty']

if18<=age<=30andbeauty>=70:
print('顏值為:%d,及格,滿足條件!'%beauty)

find_belle=True
break
else:
print('顏值為:%d,不及格,繼續~'%beauty)
continue
else:
print('性別為男,繼續~')
continue
else:
print('圖片中沒有發現人臉.')

returnfind_belle
/<code>

由於視頻是連續播放的,很難通過截取視頻某一幀,判斷視頻有出現顏值高的小姐姐。

如何利用python爬取抖音高顏值美女

另外,大部分短視頻播放時長為「10 s+」,這裡需要對每一個視頻多次截圖去做人臉識別,直到識別到顏值高的小姐姐。

<code># 一條視頻最長的識別時間RECOGNITE_TOTAL_TIME = 10#識別次數
recognite_count=1

#對當前視頻截圖去人臉識別
whileTrue:
#獲取截圖
print('開始第%d次截圖'%recognite_count)

#截取屏幕有用的區域,過濾視頻作者的頭像、BGM作者的頭像
screen_name=get_screen_shot_part_img('images/temp%d.jpg'%recognite_count)

#人臉識別
recognite_result=analysis_face(parse_face_pic(screen_name,TYPE_IMAGE_LOCAL,access_token))

recognite_count+=1

#第n次識別結束後的時間
recognite_time_end=datetime.now()

#這一條視頻出現了顏值高的小姐姐
ifrecognite_result:
pass
else:
print('超時!!!這是一條沒有吸引力的視頻!')
#跳出裡層循環
break
/<code>

一旦當前播放的視頻識別出有顏值高的小姐姐,就需要模擬保存視頻到本地的操作。

如何利用python爬取抖音高顏值美女

獲取「分享」和「保存本地」兩個按鈕的座標位置,依次利用 a db 執行點擊操作即可下載視頻到本地。

<code>defsave_video_met():
"""
:return:
"""
#分享
os.system("adbshellinputtap10001500")
time.sleep(0.05)

#保存到本地
os.system("adbshellinputtap3501700")
/<code>

另外,由於下載視頻的過程是一個耗時操作,在下載進度對話框還未消失之前,需要做一個「模擬等待」的操作。

<code>defwait_for_download_finished(poco):
"""
從點擊下載,到下載完全
:return:
"""

element=Element()
whileTrue:
#由於是對話框,不能利用Element類來判斷是否存在某個元素來準確處理
#element_result=element.findElementByName('正在保存到本地')

#當前頁面UI樹元素信息
#注意:保存的時候可能會獲取元素異常,這裡需要拋出,並終止循環
#com.netease.open.libpoco.sdk.exceptions.NodeHasBeenRemovedException:Nodewasnolongeralivewhenqueryattribute"visible".Pleasere-select.
try:
ui_tree_content=json.dumps(poco.agent.hierarchy.dump(),indent=4).encode('utf-8').decode('unicode_escape')
exceptExceptionase:
print(e)
print('異常,按下載處理~')
break

if'正在保存到本地'inui_tree_content:
print('還在下載中~')
time.sleep(0.5)
continue
else:
print('下載完成~')
break
/<code>

在視頻保存到本地之後,就可以模擬向上滑動的操作,跳到播放「下一條視頻」。

如何利用python爬取抖音高顏值美女

循環上面的操作,即可篩選出所有顏值高的小姐姐,並保存到本地。

<code>defplay_next_video():
"""
下一個視頻
從下往上滑動
:return:
"""
os.system("adbshellinputswipe5401300540500100")
/<code>

在腳本一條條刷視頻的過程中,可能會遇到一下廣告,我們需要對這類視頻進行過濾。

<code>defis_a_ad():
"""
判斷的當前頁面上是否是一條廣告
:return:
"""
element=Element()
ad_tips=['去玩一下','去體驗','立即下載']

find_result=False

forad_tipinad_tips:
try:
element_result=element.findElementByName(ad_tip)
#是一條廣告,直接跳出
find_result=True
break
exceptExceptionase:
find_result=False

returnfind_result
/<code>

結 果 結 論

運行上面的腳本,會自動打開抖音,對每一條小視頻多次進行人臉識別,直到識別到顏值高的小姐姐,保存視頻到本地,然後繼續刷下一條短視頻。

最後小編幫助大家整理了一套python基礎還有實戰的教程,下面展示了部分,希望也能幫助對編程感興趣,想做數據分析,人工智能或者希望從事編程開發的小夥伴,畢竟python工資還可以,如果能幫到你請點贊、點贊、點贊。

python視頻系列:

如何利用python爬取抖音高顏值美女

電子書系列:


如何利用python爬取抖音高顏值美女


獲取方式

如何利用python爬取抖音高顏值美女

如果你覺得文章還不錯,請大家點贊分享下。你的肯定是我最大的鼓勵和支持。


分享到:


相關文章: