“爬蟲”的是與非


“爬蟲”的是與非


爬蟲相關產業一度處於瘋狂而無序的生長狀態,然而,在當前的法律背景下,利用爬蟲技術採集信息隨時可能讓爬蟲使用者人財兩空

韓帥

“爬蟲”(Web Crawler),是按照一定的規則,自動抓取互聯網信息的程序或者腳本。作為技術或者工具的爬蟲,本身難言非法、合法。正如前些年因“快播案”而被廣泛討論的播放器的性質一樣,爬蟲如今也扮演了當年“快播案”中播放器的角色。

近兩年來,侵犯公民個人信息案件和“套路貸”案件進入高發期,在互聯網領域被廣泛應用的爬蟲技術曝光量也越來越大。特別是近期魔蠍科技等數據服務商相關人員相繼被警方調查以來,爬蟲技術逐漸成為業內乃至社會高度關注的話題。

據報道,魔蠍科技等數據服務商被調查的原因皆與爬蟲、數據等業務相關。此後,業內紛紛下架、暫停相關數據服務。可見相關事件對數據服務行業的震動之大。

在此之前,由於長期弱監管,爬蟲相關產業處於瘋狂而無序的生長狀態,業內專門約束爬蟲行為的只有Robots協議(爬蟲協議)。通俗來說,可以將Robots協議理解為網站的看門人,其職責是告知訪客哪間屋可進,哪間屋不可進。但作為一項協議,其本身不具有法律意義上的強制性。

一枚硬幣的兩面

爬蟲的是與非,取決於爬蟲為誰所用?用作何處?爬蟲技術低成本、高效率的優點自不待言。但是,作為硬幣的另一面,相伴而生的弊端也不可忽視。

對爬蟲的過度使用,造成了“被爬”網站堵塞甚至癱瘓。部分爬蟲使用者違反Robots協議,強行爬取網站信息,導致Robots協議形同虛設。

前段時間,最高人民法院在官網回應網友提出的裁判文書網運行慢、故障頻繁等情況時表示,“2018年5月初以來,大量技術公司通過爬蟲系統無限制併發訪問非法獲取裁判文書數據,造成網站負荷過大,大量正常用戶請求堵塞,訪問出現速度慢或部分頁面無法顯示等現象”。

此外,由於爬蟲技術被某些使用者用於違法犯罪活動,爬取法律保護的特定數據或者信息,導致個人信息被非法獲取,商家經營信息、技術信息等被竊取,甚至政府網站被攻擊及數據被篡改等嚴重後果。

達摩克利斯之劍

當前的法律背景下,利用爬蟲技術採集信息是時刻懸在數據服務商頭上的一把達摩克利斯之劍。這把利劍隨時可能讓爬蟲使用者人財兩空。

民法總則第一百一十一條規定,自然人的個人信息受法律保護。任何組織和個人需要獲取他人個人信息的,應當依法取得並確保信息安全,不得非法收集、使用、加工、傳輸他人個人信息,不得非法買賣、提供或者公開他人個人信息。網絡安全法第四十四條規定,任何個人和組織不得竊取或者以其他非法方式獲取個人信息,不得非法出售或者非法向他人提供個人信息。據此,公民個人信息受到民事法律和行政法律的保護,侵犯公民個人信息須承擔民法上的侵權責任,甚至可能被監管機關行政處罰。

刑法第二百五十三條之一規定,竊取或者以其他方法非法獲取公民個人信息的,構成侵犯公民個人信息罪。另根據《關於辦理侵犯公民個人信息刑事案件司法解釋》的規定,除了購買個人信息屬於非法獲取,收受或交換也都屬於非法。

從實踐來看,非法獲取公民個人信息的方式主要表現為竊取、購買、收受、交換和侵入計算機信息系統或者採用其他技術手段等。利用爬蟲技術竊取公民個人信息的行為屬於典型的侵犯公民個人信息犯罪。

自從網絡安全法、《關於辦理侵犯公民個人信息刑事案件司法解釋》實施以來,互聯網行業流行通過獲取用戶強授權的方式控制法律風險,此舉在某用程度上起到了控制風險的效果。

通過用戶授權爬取信息,即數據服務商通過向用戶索取特定網站的用戶名、密碼的方式爬取網站的信息。一般來講,爬取國家工商信息管理系統、最高人民法院裁判文書網等公共網站的相關公開信息,很難認定構成相關的刑事犯罪。

如果爬取的是商業營利性網站,一般情況下,該類網站除需要用“戶名+密碼”的方式登錄之外,網站還採取技術措施防止他人惡意登錄、攻擊。在獲取用戶授權的情況下,從刑法的角度來看,很難認定為侵犯公民個人信息犯罪。但是,可能涉及到侵犯商業秘密、侵犯著作權等相關法律規定,甚至構成侵犯商業秘密罪或者侵犯著作權罪。

如果數據服務商大規模爬取競爭對手的相關數據,則可能違反反不正當競爭法的相關規定,從而涉嫌不正當競爭。

在百度訴360公司違反Robots協議而引發的不正當競爭糾紛一案中,北京一中院在判決中認為,“搜索引擎服務商與網站服務商或所有者關於Robots協議產生糾紛時,應當遵循如下“協商-通知”程序處理……360公司的行為違反了反不正當競爭法相關規定,應賠償百度公司經濟損失及合理支出共計70萬元”。

此外,如果數據信息被認定為經營信息或技術信息,一旦爬取行為給商業秘密的權利人造成的損失達到50萬元以上,則應當按照刑法第二百一十九條侵犯商業秘密罪定罪處罰,行為人將面臨最高七年有期徒刑並處罰金的處罰。

如果爬取具有著作權屬性的文字或者信息,則有可能違反著作權法第十條規定的著作權相關的內容,涉嫌侵犯知識產權,需要承擔侵權責任。一旦前述行為的違法所得達到3萬元以上,會被認定為違法數額較大,則應當按照刑法第二百一十七條侵犯著作權罪定罪處罰,行為人將面臨最高七年有期徒刑,並處罰金的處罰。

而在未獲得用戶授權或者相關權利人授權的情況下,採取暴力破解的方式爬取相關網站的數據,還可能涉嫌非法侵入計算機信息系統罪;非法獲取計算機信息系統數據罪;提供侵入、非法控制計算機信息系統的程序、工具罪和破壞計算機信息系統罪等。

法律風險在於人

很多業內人士經常有此疑問:“使用爬蟲有這麼大風險,那怎麼使用才合法合規?”

其實,從實質上看,爬蟲只是輔助人們高效收集信息的一種技術或者工具而已,爬蟲引發的法律風險的根源不在爬蟲,而在於控制、使用爬蟲的人。

從服務數據行業的經驗來看,預防、控制使用爬蟲過程中的法律風險,須做好以下三點:一是“拿”要合法,即依法收集數據;二是“用”要規範,即規範使用存量數據;三是“管”要到位,即完善數據保護制度。


分享到:


相關文章: