怎樣抓取京東和淘寶sku對應的庫存?

接觸過很多做電商的客戶,他們經常會問這個問題:用GooSeeker網頁抓取軟件可以採到sku庫存嗎?沒有做過電商的人可能不知道sku是什麼,它的全稱是Stock Keeping Unit(庫存量單位),具體就是指下面藍框裡的數字,還有幾個相關概念,後面再給大家詳細說一下。

怎樣抓取京東和淘寶sku對應的庫存?

怎麼抓取商品sku庫存?

現在迴歸正題,用過GooSeeker產品的人都知道,只要在網頁上能看到的信息,就可以採集下來,所以,我對第一個問這個問題的人就很確定說可以做到,結果他是想要拿到商品下的所有sku庫存值,就是說,不是第一次看到的那個總庫存量,而是要把尺碼、顏色都組合一遍,然後拿到對應的庫存量。

想了一下,要採集單個sku庫存也不難,利用GooSeeker爬蟲特有的連續動作功能,通過指定要點擊的屬性對象,然後爬蟲就可以自動點擊各種屬性組合,再把庫存值爬取下來,也就是說,我們的爬蟲幫你完成了點擊和拷貝保存的工作。如果對採集sku感興趣的話,我會在另一篇文章裡分享怎麼用GooSeeker爬蟲實現自動點擊採集sku庫存。

sku、spu、item分別指什麼

好了,說完上面的問題了,下面再說說電商領域,關於商品的一些概念吧。

sku:Stock Keeping Unit 庫存單位

從庫存的角度,可以看到剩下多少存貨,要不要進貨,有時也能反映出商品的熱銷程度,比如說,缺貨的商品通常是很好賣的。從定義上看,sku是定義商品的最小單位,由商品的屬性組合決定的,比如,對於服裝來說,尺碼、顏色等可以讓買家選擇的特徵就是商品屬性,拿上面圖片的商品來說,尺碼、顏色分別有3種選擇,那這個商品就有3*3=9個sku,每個sku都有一個唯一編碼,作用就像身份證那樣,用來區分和記錄不同屬性組合的信息;

spu:Standard Product Unit 標準化商品

具體來說,spu是商品信息聚合的最小單位,在服裝行業,就是指不同的品類,比如T恤、牛仔褲等等,在手機行業,就是具體到手機型號了,通常搜索一個spu,你會找到很多相同的商品,分別是由不同的商家在售,通俗地講,spu就是指具有相同屬性集合的一類商品吧。

Item:商品

在搜索關鍵詞後,看到的那一個個商品,比如,搜索T恤,就會看到很多T恤,任意點擊一個T恤(item)進到詳情頁面,然後選擇顏色、尺碼,看到的就是sku了,從範圍大小上講,spu>item>sku。

淘寶商品、京東商品的區別

最後還要說一下淘寶和京東在這3個概念的區別。

淘寶為了展示靈活,是用item來代表商品的,在商品網址裡可以看到這個item的編號id,而sku是包含在item裡的,沒有單獨的id,所以把尺碼和顏色任意組合,商品網址都不會改變,在不選擇任何屬性組合時,你可以看到item的總庫存,在選擇了屬性組合後,還可以看到單個sku庫存;

怎樣抓取京東和淘寶sku對應的庫存?

京東上是用sku代表商品的,每一個sku都有唯一的編碼id,也就是說在商品詳情頁裡點擊屬性組合,商品網址就會發生變化,實際上是切換到另一個sku編碼,但是京東上不直接顯示庫存,只會告訴你有貨還是沒貨,所以,你只能看到sku編碼,庫存數量是看不到的,雖然有點遺憾,但是sku也許不是那麼重要吧,因為更多人是想要收集sku組合和對應的價格,而抓取方法還是用前面第3段提到的方法。

怎樣抓取京東和淘寶sku對應的庫存?


分享到:


相關文章: