頁面日誌採集(埋點)思路及其實現

頁面日誌採集

  1. 頁面瀏覽日誌採集。指的是當一個頁面被瀏覽器或者APP加載呈現時採集的日誌,也是頁面瀏覽量(Page View, PV)和訪客數(Unique Visitors,UV)的統計基礎。
  2. 頁面交互日誌採集。獲取用戶操作日誌,通過量化獲知用戶的興趣點或者體驗優化點。

頁面瀏覽日誌採集流程

目前典型的網頁訪問過程是以客戶端發送請求、服務器響應並返回所請求的內容進行的。

客戶端日誌採集

如果要進行日誌採集的動作,需要在服務器響應並返回所請求的內容之後,對應頁面的onload事件。 一般需要採集當前頁面參數、瀏覽行為的上下文信息(如讀取用戶訪問當前頁面時的上一個頁面)以及一些運行環境信息(如當前瀏覽器和分辨率等)。

客戶端日誌發送

正常情況下,在進入頁面onload生命週期的時候,向服務端發送日誌信息。採集到的日誌信息一般以URL參數的形式放在HTTP日誌請求的請求行內。

服務端日誌收集

日誌服務器收到客戶端發來的日誌請求後,一般會立即向瀏覽器返回一個請求成功的響應,以免對頁面的正常加載造成影響。

服務器端日誌解析存檔

頁面交互日誌採集

隨著互聯網業務的發展,僅瞭解用戶訪問過的頁面已經遠遠不能滿足用戶細分研究的需求,在很多場景下,需要了解用戶在訪問某個頁面時具體的互動行為特徵。因為這些行為往往不會觸發頁面的特定事件,因此很多時候需要我們手動收集。

頁面日誌採集面臨的問題

  1. 識別流量攻擊、網絡爬蟲和流量作弊。
  2. 數據標準化(結構化)。
  3. 無效數據剔除。
  4. 降低日誌服務器壓力。

日誌採集實現思路

首先明確我們想要採集的數據-頁面瀏覽日誌和頁面交互日誌。正常情況下我們會在進入頁面時發送日誌信息,但是用戶在每個頁面的停留時間我們將很難統計到。因此考慮在離開頁面時發送日誌信息,並且在頁面跳轉時將上一個頁面的一些信息也一併加入日誌信息中。由於在離開頁面時發送日誌,因此還需要考慮監控客戶端的異常關閉狀態。

## 日誌採集Vue實現

在下一節中將使用Vue進行多端埋點並配合服務端實現日誌採集。

頁面日誌採集(埋點)思路及其實現


分享到:


相關文章: