HTTP 協議的前世今生

HTTP 協議全稱是超文本傳輸協議(Hypertext Transfer Protocol),這裡面需要理解三個地方:超文本、傳輸、協議,下面就從 HTTP 協議的歷史講起。

20 世紀 60 年代,美國國防部高等研究計劃署(ARPA)建立了 ARPA 網,它有四個分佈在世界各地的節點,被認為是互聯網的始祖。

到了 70 年代,基於對 ARPA 網絡的實踐和思考,研究人員發明出了著名的 TCP/IP 協議,並在 80 年代中期進入了 UNIX 內核,使更多計算機接入了互聯網。

HTTP 誕生

HTTP 協議的前世今生

這位大師叫蒂姆·伯納斯·李(Tim Berners-Lee),是萬維網的創始人,簡單點說,是當代互聯網的創始人。

在 1989 年,他發表了一篇論文,提出了在互聯網上構建超鏈接文檔系統的構想,在這篇論文裡他確立了三項關鍵技術:

  • URI:統一資源標識符,作為互聯網上資源的唯一標識
  • HTML:超文本標記語言,描述超文本文檔
  • HTTP:超文本傳輸協議,用來傳輸超文本

這三項技術直接奠定了我們當今 Web 世界的技術,蒂姆把它稱為萬維網(World Wide Web)。

所以,1989 年,HTTP 誕生了。

HTTP/0.9

在 20 世紀 90 年代初,互聯網世界還是一片荒漠,計算機處理能力低下,存儲容量小,網速很慢。網絡上的絕大多數資源都是純文本資源,所以 HTTP 協議也是純文本格式的。

為了便於服務器和客戶端處理,蒂姆最初設想的系統裡的文檔都是隻讀的,所以只允許用戶通過 GET 請求從服務器上獲取 HTML 文檔,並且在響應之後立即關閉連接,功能非常有限。

這一版 HTTP 協議雖然很簡單,但是作為一個原型,充分驗證了 Web 服務的可行性。

HTTP/1.0

1993 年,美國國家超級計算應用中心(NCSA)開發出了 Mosaic,是第一個可以圖文混排的瀏覽器,隨後又在 1995 年開發出了服務器軟件 Apache,簡化了 HTTP 服務的搭建工作。

同一時期,在 1992 年發明了 JPEG 圖像格式,1995 年發明了 MP3 音樂格式。

這些新技術的出現,促使 HTTP 協議開始添加各種特性,從用戶需求的角度促進了 HTTP 協議的發展。

在已有實踐的基礎上,經過一系列的草案,HTTP/1.0 在 1996 年正式發佈。主要增加了以下幾部分內容:

  • 增加了 HEAD/POST 等新方法
  • 增加了響應狀態碼
  • 增加了版本號
  • 增加了 Header 頭部的概念
  • 增加了 Content-Type,傳輸數據不再僅限於文本

但是 HTTP/1.0 並不是一個標準,只是記錄已有實踐和模式的一份參考文檔,不具有實際的約束力,相當於一個備忘錄。

HTTP/1.1

1999 年,HTTP/1.1 發佈了 RFC 文檔,編號為 2616,從版本號我們就可以看到,HTTP/1.1 是對 HTTP/1.0 的小幅度修正。但是一個重要區別是,它是一個正式的標準,而不是一份參考文檔。但是 HTTP/1.1 說是小幅度修正也不太確切,這裡面主要變更點有:

  • 增加了 PUT/DELETE/OPITIONS 等新方法
  • 增加了緩存控制和管理 Cache Control
  • 明確了連接管理,允許持久連接 Keepalive
  • 允許響應數據分塊,利於傳輸大文件(Chunked)
  • 強制要求 Host 頭

我們當今世界的所有知名網站,都是在這個時間點左右創立的,可以說有了 HTTP/1.1,才開創了 Web 1.0、Web 2.0 時代。

不過,由於 HTTP/1.1 太過龐大和複雜,因此在 2014 年又進行了一次修訂,拆分為六份較小的文檔,7230 /7231/7232/7233/7234/7235

這六份文檔增加了兩個大的需求:

  • 加大了 HTTP 的安全性,比如使用 TLS 協議
  • 讓 HTTP 可以支持更多的應用,目前已經支持四種網絡協議: 傳統的短連接 可重用 TCP 的長連接模型 服務端 PUSH 模型 WebSocket 模型

HTTP/2

HTTP/1.1 存在兩個問題:

  1. 連接慢,請求是串行的,需要保證順序,例如一個網頁中可能會有多個資源
  2. 性能差,HTTP/1.1 是以文本的方式,藉助 CPU 的 zip 壓縮方式減少網絡帶寬,但是耗費了 前端和後端的 CPU

2010 年,Google 推出了新的 SPDY 協議,並應用於自家的服務器,HTTP/2 就是以 SPDY 為基礎的,它的特點主要是:

  • 使用二進制傳輸,不再是純文本
  • 可以在一個 TCP 連接中併發多個 HTTP 請求,移除了 HTTP/1.1 中的串行請求
  • 使用 HPACK 算法來壓縮頭部
  • 允許服務器主動向客戶端推送數據
  • 增強了安全性,基於 TLS 協議

HTTP/3

HTTP/2 的主要問題有隊頭阻塞問題,也就是說,若干個 HTTP 請求在複用一個 TCP 的連接,那麼一旦發生丟包,造成的問題就是所有的請求都必須等待這個丟了的包重傳回來,哪怕這個包不是我這個 HTTP 請求的。

基於此,Google 發明了 QUIC(Quick UDP Internet Connections)協議,它是基於 UDP 的。因此,它就解決了以下幾個問題:

  • UDP 是無序的,因此不存在隊頭阻塞問題
  • QUIC 有一套自己的丟包重傳和擁塞控制的協議
  • HTTPS 握手通常需要六次網絡交互,QUIC 直接將 TLS 和 TCP 合併成了三次握手
HTTP 協議的前世今生

所以,QUIC 是一個在 UDP 之上的偽 TCP + TLS + HTTP/2 的多路複用協議。在未來,QUIC 協議成熟了的話,是有可能取代 TCP 協議的。

關注公眾號「原少子楊」回覆 Nginx 領取知識圖譜


分享到:


相關文章: