body-parser是非常常用的一個express中間件,作用是對post請求的請求體進行解析。使用非常簡單,以下兩行代碼已經覆蓋了大部分的使用場景。
本文從簡單的例子出發,探究body-parser的內部實現。至於body-parser如何使用
入門基礎
在正式講解前,我們先來看一個POST請求的報文,如下所示。
POST /test HTTP/1.1
Host: 127.0.0.1:3000
Content-Type: text/plain; charset=utf8
Content-Encoding: gzip
chyingp
其中需要我們注意的有Content-Type、Content-Encoding以及報文主體:
【1】Content-Type:請求報文主體的類型、編碼。常見的類型有text/plain、application/json、application/x-www-form-urlencoded。常見的編碼有utf8、gbk等。
【2】Content-Encoding:聲明報文主體的壓縮格式,常見的取值有gzip、deflate、identity。
【3】報文主體:這裡是個普通的文本字符串chyingp。
body-parser主要做了什麼
body-parser 實現的要點如下:
【1】處理不同類型的請求體:比如text、json、urlencoded等,對應的報文主體的格式不同。
【2】處理不同的編碼:比如utf8、gbk等。
【3】處理不同的壓縮類型:比如gzip、deflare等。
【4】其他邊界、異常的處理。
處理不同類型請求體
解析text/plain
客戶端請求的代碼如下,採用默認編碼,不對請求體進行壓縮。請求體類型為text/plain。
服務端代碼如下。text/plain類型處理比較簡單,就是buffer的拼接。
解析application/json
客戶端代碼如下,把Content-Type換成application/json
服務端代碼如下,相比text/plain,只是多了個JSON.parse()的過程。
解析application/x-www-form-urlencoded
客戶端代碼如下,這裡通過querystring對請求體進行格式化,得到類似nick=chyingp的字符串。
服務端代碼如下,同樣跟text/plain的解析差不多,就多了個querystring.parse()的調用。
處理不同編碼
很多時候,來自客戶端的請求,採用的不一定是默認的utf8編碼,這個時候,就需要對請求體進行解碼處理。
客戶端請求如下,有兩個要點。
【1】編碼聲明:在Content-Type最後加上;charset=gbk
【2】請求體編碼:這裡藉助了iconv-lite,
對請求體進行編碼iconv.encode('程序員小張', encoding)
服務端代碼如下,這裡多了兩個步驟:編碼判斷、解碼操作。
首先通過Content-Type獲取編碼類型gbk,然後通過iconv-lite進行反向解碼操作。
處理不同壓縮類型
這裡舉個gzip壓縮的例子。客戶端代碼如下,要點如下:
【1】壓縮類型聲明:Content-Encoding賦值為gzip。
【2】請求體壓縮:通過zlib模塊對請求體進行gzip壓縮。
服務端代碼如下,這裡通過zlib模塊,對請求體進行了解壓縮操作(guzip)。
寫在後面
body-parser的核心實現並不複雜,翻看源碼後你會發現,更多的代碼是在處理異常跟邊界。
另外,對於POST請求,還有一個非常常見的Content-Type是multipart/form-data,這個的處理相對複雜些,body-parser不打算對其進行支持。
閱讀更多 妙思維JS加加 的文章