B站視頻遭大規模侵權,原創網站如何防範“爬蟲”抓取信息?

中國之聲《新聞縱橫》報道:近期,知名視頻彈幕網站嗶哩嗶哩(bilibili)的不少用戶反映,他們的視頻、暱稱、頭像及用戶評論等,被某新成立的K視頻網站盜用。

B站視頻遭大規模侵權,原創網站如何防範“爬蟲”抓取信息?

B站視頻遭大規模侵權,原創網站如何防範“爬蟲”抓取信息?

B站的視頻原來是被網絡“爬蟲”搬走?

B站視頻、評論和up主的信息是如何被K視頻網站拿走的呢?

媒體分析,應該是K視頻網站利用網絡“爬蟲”抓取了B站上公開的視頻、評論乃至up主的個人主頁信息。

B站視頻遭大規模侵權,原創網站如何防範“爬蟲”抓取信息?

網絡“爬蟲”,又被稱為網頁蜘蛛,網絡機器人,是按照一定的規則,自動地抓取網絡信息的程序或者腳本。

“爬蟲”不僅能夠爬取視頻信息,更可以爬取商品類目、圖片、評論、價格、個人信息等關鍵數據。這些“爬蟲”的非法操作不僅消耗了網站和平臺的服務和帶寬資源,更會導致重要的數據洩露。

“爬蟲”搶網站的資源,用戶和企業都受傷

“爬蟲”的非法操作在電商、航空和互聯網金融上表現尤為明顯。以航空網站的“爬蟲”為例。

首先,代理公司利用“爬蟲”抓取航空公司官網機票的信息,一旦發現低價和緊俏機票放出,即利用虛假客源身份進行批量預定但不實際支付,以達到“佔座”的目的,導致真正旅客幾乎無法購買到這些機票。隨後,機票代理公司會通過其自身銷售渠道找到需要購票的客源,加價後轉售給旅客。

B站視頻遭大規模侵權,原創網站如何防範“爬蟲”抓取信息?

由於航空售票系統允許在賬期內反覆訂、退票,這就給了代理公司的“爬蟲”提供了便利。代理公司會在訂單失效前再追加虛假身份訂單,繼續“霸佔”該低價票,如此反覆,直至找到真正客源售出為止。

頂象技術的“反爬蟲”服務

頂象 “數據防爬”通過多維數據採集的大數據+模型,能夠精準鑑別訪問設備的真偽;其基於強大算法技術支撐,提供毫秒級響應,幫助網站和平臺做好實時識別業務風險決策;再借助精準人機識別的無感驗證,從而有效識別各類網絡“爬蟲”,防禦對敏感信息爬取。

某航空公司在部署頂象技術的“數據防爬服務”後,有效攔截了大部分“爬蟲”的非查詢請求,使超過90%的用戶正常免受驗證碼的打擾,超過95%的惡意請求被直接攔截。

頂象技術安全專家表示,防禦“爬蟲”非法操作不僅需要技術手段,更需要業界自律以及完善的法律法規來約束。


分享到:


相關文章: