1、前言
目前,HTTP協議是互聯網上應用最為廣泛的一種網絡協議,也是前端er接觸最多的一種協議。通過閱讀http模塊在nodejs中的實現,能夠更深入的瞭解HTTP協議。HTTP協議是基於TCP協議之上的應用層協議,它的實現離不開TCP/IP協議族。而具體到代碼實現,http模塊依賴於net模塊。
如下圖所示:在nodejs中,http通過net模塊傳輸數據,得到數據之後依靠HTTP_PARSER對數據進行解析。
2、源碼
啟動一個HTTP服務
nodejs中啟動一個HTTP服務很簡單,就是實例化一個Server對象,並且監聽某個端口:
SERVER類
Server類繼承於net.Server,並監聽’connection‘事件。
在Server類中,主要做了兩件事:
初始化NET模塊並建立TCP網絡監聽
監聽自身的request事件。
當客戶端請求到來的時候,Server實例會首先監聽到 'connection' 事件,建立起TCP連接並在connectionListener中暴露出socket對象。接下來,HTTP模塊就通過socket對象與客戶端進行數據交互。
當一個請求到來後,Server會觸發自身的 request 事件,調用 requestListener 方法,即創建Server實例時傳入的回調函數。
注
socket對象類似於TCP協議的一個實現,可以通過它與客戶端進行數據交互;
在 connectionListener 函數中,還初始化了parser實例,並給它綁定了一個 onIncoming 函數 HTTP Parser;
整個解析流程在 connectionListener 中進行,socket 通過 'data' 事件獲取TCP推入的數據。
當socket獲取到數據之後,會先對數據進行解析,即:parser.excute(),解析工具是parser。值得說明的是,作者為了實現對 parser 的重用, parser是從一個'FreeList池'中獲取的。
Parser(common.js) 繼承自 HTTPParser(node_http_parser.cc),並綁定了4個解析週期回調函數:parserOnHeaders、parserOnHeadersComplete、parserOnBody、parserOnMessageComplete。
在執行 parser.execute 過程中,HTTPParser 會在解析週期內回調這些函數。
解析的具體流程
1、TCP數據到達時, 先執行execute()
2、順藤摸瓜,我們發現parser.excute 就是 Excute(node_http_parser.cc)。而Excute也只是一個外包而已,具體工作是http_parser_excute(http_parser.c)搞定的。
node_http_parser.cc 只是對 http_parser.c 的一層包裝,http_parser.c依靠對外暴露的7個回調週期函數與 node_http_parser.cc 進行數據交互。
想了解更多,請查看http_parser.c文檔(https://github.com/nodejs/http-parser)
3、http_parser.c只有兩類回調:HTTP_CB、HTTP_DATA_CB。通過重載的方式,在這兩類函數中註冊了8個週期函數,如下圖:
4、雖然http_parser註冊有8個回調函數,但 node_http_parser.cc 對外只暴露出四個週期函數:
parserOnHeaders
parserOnHeadersComplete
parserOnBody
parserOnMessageComplete
5、當 http_parser.c 解析到 on_headers_complete 時,執行HTTP_CB(on_headers_complete)回調函數,如圖:
函數內會執行 kOnHeadersComplete 回調函數,即:parserOnHeadersComplete 函數(common.js)
6、此時請求頭解析基本完成,接下來創建一個IncomingMessage的實例,然後把請求頭數據包裝到該實例上。
執行 onIncoming 回調函數,並把得到的IncomingMessage實例作為參數傳遞進去。
7、 在 parserOnIncoming 中,創建一個ServerResponse實例。
具備了req、res兩個實例,接下來觸發Server監聽的 request 事件。
在 Server 實例化時的,requestListener是作為函數參數對 request 事件進行監聽的。
8、回到Server創建時:
綜上所述,http_parser 解析完 header 之後,就會觸發 request 事件。
那body數據放到哪裡呢,其實body數據會一直放到流裡面,直到用戶使用data事件接收數據。也就是說,觸發request的時候,body並不會被解析。
3、流程梳理
完整的http請求是這樣的:
客戶端發起HTTP請求,首先觸發Server端的connection事件,建立TCP鏈接。
Server接收到connection事件後,建立TCP連接,並暴露出套接字,通過套接字監聽'data'事件;初始化http-parser,為後續解析數據備用。
HTTP請求數據到達Server端,parser執行execute方法進行解析,請求頭解析成功後,通過回調觸發request事件。
至此,我們在Server回調函數中,就接收到了此次http請求的request
4、結語
由於nodejs不少底層庫都是C++/C編寫的,在閱讀、調試的過程中非常不便。我自己在讀源碼的時候,也只是著重看的JS部分源碼。比如,TCP的三次握手、四次揮手,就沒深究它的實現細節啦。 以上分析沒有涉及到http-body的解析,對於有body的網絡請求,實際情況要更加複雜一些,還有一些細節沒有完全搞清。等下次總結、分享,我會盡量把漏掉細節都補上。