用python重新定義【2019十大網絡流行語】科技頭條網

用python重新定義【2019十大網絡流行語】

博學之，審問之，慎思之，明辨之，篤行之。

“文明互鑑真硬核，

融梗檸檬誰覺得。

霸凌第一九九六，

區塊鏈不知太難了。”

12月1日，《咬文嚼字》編輯部以一首“順口溜”發佈2019年度十大流行語。“文明互鑑”、“區塊鏈”、“硬核”、“融梗”、“××千萬條，××第一條”、“檸檬精”、“996”、“我太難/難了”、“我不要你覺得，我要我覺得”、“霸凌主義”十條流行語入選。

微博評論下有很多網友紛紛表示，XXX為什麼能上榜？XXX為什麼沒上榜？

這點呢，小五表示理解，畢竟採用不同的統計口徑得出的結論可能不同。

那麼，小五乾脆也自己定義個統計口徑，重新“定義”一下【2019十大網絡流行語】

此處致敬一下重新定義的鼻祖——羅老師。

獲取數據

通過搜索“網絡流行語”，可以發現已經有網站幫我們做了整理。

利用python爬蟲可以獲取該網站的2019年度所有網絡流行語。

<code>def main():
    data = []
    n = 1
    for i in range(4542,5589): 
        dic = {}
        url = 'https://www.lxybaike.com/index.php?doc-view-'+str(i)+'.html'
        print('已成功採集{}條數據'.format(n))
        html = restaurant(url)
        doc = pq(html)
        dic['tittle'] = doc('#doctitle').text()
        dic['num'] = doc('#doc-aside > div.columns.ctxx > ul > li:nth-child(1)').text()
        data.append(dic)
        time.sleep(random.random())
        n = n + 1
    return data  /<code>

爬取成功√

共929個詞語。

我們在獲取這些熱門流行詞的同時，也獲取了他們的一些其他數據，比如瀏覽次數和出現時間。

但瀏覽次數很難作為評判這個詞語是否熱門的指標，畢竟大家又不是都來這個網站搜索，所以還是需要一個全網的數據才更準確一點。

一開始選擇了百度指數，結果發現很多詞語沒有收錄，需要付費。於是我就選用了搜狗指數！

將剛才爬取得到的929個網絡流行語，可以根據下面式子來構造url。

<code>urls= 'http://zhishu.sogou.com/index/searchHeat?kwdNamesStr='+str(name)+'&timePeriodType=YEAR&dataType=SEARCH_ALL'/<code>

再循環爬取依次得到他們的年度平均搜索指數。

成功得到2019年度網絡熱門流行詞排行榜（凹凸玩數據版）！

其中標記綠色的詞語為2018年末出現，在2019年開始流行，在統計時也列入列入2019流行語中。

2019網絡熱門流行詞排行榜

根據上文得到的熱門流行詞排行榜，小五又蒐集了一些網上的資料，利用PS來製作了十張流行詞的解釋圖。

下面開始頒獎：

一千個人眼中就有一千個哈姆雷特。

相信每個人心裡都有自己的一個流行語排行榜。

不知道小五重新定義的排行榜與你心中的相差多少？

分享到:

閱讀更多 愛編程的大美妞 的文章

關鍵字: Python 網絡爬蟲 2019你為誰驕傲

用python重新定義【2019十大網絡流行語】

相關文章:

小米太無恥了。

蹭熱點！說說我理解的手機包裝盒事件。

蘋果公司正式發佈iPhone SE二代手機

華為河圖、麒麟芯片和鴻蒙OS三駕馬車並行？華為生態建設佈局深遠

小米高管表示，四千毫安時 5G 手機，和三千多毫安時 4G 手機一樣

5G畫風變了：麒麟985落地首跑，榮耀坐上開往高端的「地鐵」

旗艦手機標配Wifi 6 換Wifi 6路由器的時機到了嗎？

2020年5G手機賣不動？繼蘋果砍單25%之後，華為小米紛紛跟砍？

幹翻華為P40系列 榮耀30也玩中

程序員辭互聯網工作，跨行傳統上市公司，上班第1天就蒙了

蘋果發佈新款iPhoneSE，3299元起售

我很糾結：我究竟適不適合做亞馬遜電商？看了這三條你就知道了

請仔細閱讀，關於跨境電商你想知道的都在這兒

騙子手段太“精明”：商家賠了貨物又賠款，亞馬遜平臺騙術大揭祕

做跨境電商這麼多年，今天才知道給國外客戶發文件原來這麼簡單

值得收藏！三類賣家三種選品方案，總有適合你的一個……

萬萬沒想到！亞馬遜平臺上面賣床單竟營收一個億！你還在等什麼？

做店鋪這麼多年，今天才知道我的listing突然被封，竟是因為……

亞馬遜小白看過來！請採納這些：亞馬遜選品和運營的小建議

亞馬遜賣家如何爆單？跨境精細化運營攻略必看

不收保證金、入住費、年費，還免三個月佣金，我也想入駐這個平臺

馬雲終於要辭職了，留下的話句句觸動人心

等等，明年5G手機將迎來大降價

微信公開課PRO版2019正在進行時，往屆各自都有什麼黑科技

推出「信任分」升級「閃購」，美團本地生活這盤棋有多大？

5G我們超越了6G我們也將領先! 美國為什麼會害怕失去5G領導地位呢

界讀｜華為：幫助英國共渡疫情難關，無端批評令英國蒙受損失

為什麼華為今天可以傲視群雄，在世界上立於不敗之地？

血戰「在線辦公」，阿里、騰訊、字節、華為的底牌與大殺器

2020年最強拍照旗艦來了 華為P40系列多項業界首創 香！

今天聊一聊直播

通過直播賺錢不容易，既要豁得出去，又要端得起來

AI和自動化技術聯手，最終會讓60%的工人失去現有的飯碗。

這個網還能不能好好上了？今日全球IPv4地址正式耗盡

12306系統不行？內行人告訴你它有多牛，阿里騰訊高手去了也膜拜

有內幕？美國防部授與微軟百億雲合同，亞馬遜不滿發起訴訟

未來之芯--RISC-V總部從美國遷往瑞士，華為、阿里是其成員

神話還能繼續嗎？幾度過山車，比特幣半年來首次跌破7000美元

劉強東卸任後，突然宣佈一個“好消息”，讓馬雲措手不及！

蘋果的瘋狂其實從未停止，AirPower或將重新啟航

曾保護近4億中國人的電腦，卻因得罪阿里、騰訊，慘遭市場淘汰

互聯網流量需求增大 希臘民眾“宅生活”考驗網速

互聯網科技企業，傳統辦公模式該走向何處?

微信又悄悄上線一新功能～網友卻開始擔心

正式確認！孫正義退出市值5959億阿里，20年與馬雲成就彼此

科技添柴“非接觸經濟”升溫

好像在哪見過？華為nova7官宣 餘承東:何必只有一點點

行業紅利、資本湧入，疫情後的在線教育聚師網如何“涅槃”

數字貨幣真的來了？首吃螃蟹者傳出，碰一碰功能露臉

實例 | 200 SMART運動控制基本指令詳解

男人追求到女生一半卻不追了，到頭來是誰最傷？

為什麼有些人認為“暴君”巴沙爾不是獨裁？

美國經常凍結敵對的被制裁人員在美資產，那麼這些被制裁人員為啥要把資產放美國呢？

為什麼說進不了重點高中重點班，從概率上說幾乎就與名牌大學無緣了？

為什麼走讀學生比住校生成績好？

湯姆哈迪主演的電影《毒液》有可能在國內上映嗎？

有些普通家庭寧願欠銀行幾十、上百萬給孩子買房結婚，卻不願意讓孩子拿這些錢去創業，這是什麼心態？

如果《手機2》上映了，你會去看嗎？

范冰冰就“陰陽合同”等偷逃稅問題致歉，這事兒對她來說打擊有多大？她還會在娛樂圈復出嗎？

你覺得咸陽師範學院和渭南師範學院怎麼樣？

西安的長安區是怎麼劃分的？

有哪些大學在西安？

甘肅崆峒山徒步遊的最佳路線是什麼？

有人說以前經常聽到煤礦出事故，現在很少聽到了，你怎麼看？

手機後面放錢是什麼意思？

四川出了多少個元帥，你最崇拜的是哪個？

井岡山人文地理怎麼樣，風景有哪些？

世界上最大的隕石坑在哪裡，有多大，是如何形成的？

如果地球上所有的雲都變成雨落下來，海平面會上升幾米？

為什麼不做一條大管子把南極或北極的冷空氣引到南方來給夏天降溫？有實現的可能性嗎？

如何看待稅務部門認定范冰冰偷逃稅款，追繳稅款及罰款近9億，如繳清不予追究刑事責任？

靈芝對肝臟有害嗎？

中考真的能決定高考成績嗎？

二手房最高降價達30%以上，樓市降溫為何如此迅猛？

姚明在火箭生涯總薪資是多少？具體每個賽季是如何分配的？

十年前的韓國賽，林丹向老帥李矛扔拍子是怎麼回事？

有人說月球正在遠離地球，這是為什麼？

一個熟悉的女人，喝你喝過的水是什麼意思？

幹翻華為P40系列榮耀30也玩中

2020年最強拍照旗艦來了華為P40系列多項業界首創香！

互聯網流量需求增大希臘民眾“宅生活”考驗網速

好像在哪見過？華為nova7官宣餘承東:何必只有一點點