反爬蟲?來了解下這個爬蟲終結者

根爬取數據類型而分,爬蟲有不少種類,比如爬取Email地址的、爬取商品價格的、爬取圖片的,而最多的是爬蟲內容的。內容數據爬蟲是為氾濫的!

爬蟲讓很多人對其深感苦惱,今天,帶大家來了解一個爬蟲終結者,對內容數據防護非常強勁,幾乎可以100%攔阻所有內容爬蟲!它就是ShareWAF-ACS。

ACS是Anti Content Spider的簡稱縮寫,直面其意:反內容爬蟲。是國內安全廠商ShareWAF推出的一款反爬蟲產品。

反爬蟲?來了解下這個爬蟲終結者

根據官方介紹,ShareWAF-ACS採用動態字體變碼加密技術,可防一切內容爬蟲!

反爬蟲是個技術活,那麼ACS是靠什麼技術實現反爬防護的呢?

總結而言,它有兩大技術點:

1、字體加密、動態變碼;

2、動態字體文件保護。

來看反爬效果演示:

1、內容防複製、防爬取

反爬蟲?來了解下這個爬蟲終結者

這是在ACS保護下的一個網頁。 嘗試複製網頁中的內容,並粘貼到別處。

先複製:

反爬蟲?來了解下這個爬蟲終結者

再粘貼:

反爬蟲?來了解下這個爬蟲終結者

可見,複製粘貼後的文字出現了亂碼,即內容不能被正常獲取、不能被爬蟲爬取。

2、防破解

ACS採用的是字體變碼技術,打開剛才的網頁,查看網頁源碼:

反爬蟲?來了解下這個爬蟲終結者

可以看到某些文字內容並不是正常的“文字”,而是一種編碼,是自定義的文字Unicode編碼。

而且是“變碼”,編碼會變化:

反爬蟲?來了解下這個爬蟲終結者

由此可防止編碼被分析。

說倒底,這是一種自定義字體編碼技術,更進一步思考,它人可能會下載網頁中的字體文件,破解字體與編碼的對應關係。

為了防止這種情況出現,ACS還採用了動態字體文件路徑的保護手段,每次訪問網頁,提供的都是不同的字體路徑:

反爬蟲?來了解下這個爬蟲終結者

這就是動態字體文件保護功能了。

反爬蟲?來了解下這個爬蟲終結者

更安全的是,字體文件是防下載的:

反爬蟲?來了解下這個爬蟲終結者

文字不能被正常複製,即:不能爬取。

字體編碼是加密的、動態變化的;字體文件也是被保護的不能被分析,即:反爬不能被破解。

那麼,應該說:不錯!爬蟲終結者來了!


分享到:


相關文章: