放任“假數據”會導致好的產品默默無聞、不見天日,後來者為了追趕前人,也只能選擇用“假數據”吸引關注。
近日,馬蜂窩被指數據造假,曝光此事的微信公眾號“小聲比比”和乎睿數據團隊聲稱,馬蜂窩作為核心資產的2100萬“真實點評”中有1800萬條是通過機器人從大眾點評和攜程網等競爭對手那裡抄襲的。
僅餐飲、酒店版塊就有7454個抄襲賬號,平均每個賬號從攜程、藝龍、美團、Agoda、Yelp等平臺抄襲搬運了數千條點評,合計抄襲572萬條餐飲點評,1221萬條酒店點評,佔馬蜂窩官網聲稱總數的85%。更令人震驚的是,許多馬蜂窩官方認證的賬號竟然也是抄襲賬號,其中更是出現了某賬號在同一天忽男忽女、同時出現在不同城市的現象。
不僅如此,將馬蜂窩與大眾點評進行比較,會發現二者的數據趨勢截然相反,與其它平臺評論事件多集中在節假日和飯店不同,馬蜂窩評論多集中在工作日、工作時間,且後者的點評數量還會在特定時間節點指數級增長,隨後出現斷崖式回落,這也側面反映著馬蜂窩數據的可疑。
目前估值175億、在世界盃期間砸下2億廣告費的馬蜂窩今年以來受到了大眾的普遍關注。八月份因定錯酒店,建議客戶從俄羅斯打車去希臘,最終賠償8萬打車費一事剛剛落下帷幕,“假數據”一事又引發了大量爭論,據悉,曝光此事的文章目前閱讀量已超過300萬。
事件發酵兩天後,馬蜂窩官方發佈回應,稱對全站數據進行核查後,“點評內容在馬蜂窩整體數據中僅佔2.91%,虛假點評號在總體中的佔比更是微乎其微”,其用戶分享的主要載體是遊記、攻略和問答,並稱“這才是馬蜂窩的真實價值所在”並向法院提起訴訟,起訴乎睿數據團隊和“小聲比比”微信公眾號負責人丁子荃名譽侵權,隨後法院立案。
面對質疑,微信公眾號“小聲比比”和乎睿數據團隊再次發聲,稱馬蜂窩在事件曝光後刪除大量點評數據,平均每個抄襲賬號清空了2662條點評。並在該文章下的評論中回答網友說,已下載好了全部原始數據,無懼出庭應訴。
事件一波三折引人熱議,先不討論名譽侵權一案的訴訟結果會怎樣,我們先從法律角度談談利用爬蟲抓取其它公司用戶發佈的內容,發佈在自己的平臺構成侵權嗎?
首先,根據我國大陸對商業信息保護的法律條款,只有經過嚴格定義的知識產權信息才受到財產性信息的保護。
其次,網絡平臺上用戶發佈的公開信息是一種財產性信息和公共信息。但並不是經過嚴格定義的知識產權信息。因此,僅僅是複製其它平臺的點評到自己的平臺上似乎不構成侵權。
但是,《反不正當競爭法》規定:“經營者不得對其商品的性能、功能、質量、銷售狀況、用戶評價、曾獲榮譽等作虛假或引人誤解的商業宣傳、欺騙、誤導消費者。”而對於點評類數據的大量採集,明顯造成不正當競爭,存在違法可能。
大眾點評和百度地圖之間就發生過類似的紛爭。2016年,大眾點評因百度地圖大量引用大眾點評的評論未署名來源,起訴百度索賠9000萬,最終大眾點評勝訴,儘管賠償金額僅有300萬元,但現在百度地圖的評論裡已經都標明瞭來源屬於大眾點評,為大眾點評帶來了不少流量。
由此可見,像馬蜂窩這類利用爬蟲手段獲取其它網站點評等內容的行為並不少見。除了爬蟲這種“殭屍水軍”外,還有許多真水軍的假評論。
買東西時需要在電商購物平臺的假好評中篩選出真實評論、看電影時需要在假影評中提取有用的信息、微博評論中大量的雷同內容、視頻網站上令人震驚的點擊量、微信公眾號虛假的閱讀量,這一切的背後甚至形成了一條“假數據”產業鏈。消費者想要做出合理的消費決策,需要在“假數據”的汪洋大海里練就海底撈針的本領。而在這種環境下購物或者選擇內容,需要付出的精力與時間已經達到了令人不舒服的狀態。
如果繼續放任造假、抄襲發展必將會導致劣幣驅逐良幣的現象發生,好的產品默默無聞、不見天日,後來者為了追趕前人,也只能選擇用“假數據”吸引關注。
但值得慶幸的是,在技術的發展之下,我們將有可能在未來應用自然語音識別、人工智能、複雜網絡等理論與技術手段,讓信息變得越來越透明,讓產品迴歸它本身的價值。這是最好的時代,也是最壞的時代,慶幸的是,我們還能看見希望。
閱讀更多 金磚肆國 的文章