上·一篇文章帶你熟悉 TCP

同樣的,本文篇幅也比較長,先來一張思維導圖,帶大家過一遍。

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

一圖看完本文

一、 計算機網絡體系結構分層

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

計算機網絡體系結構分層

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

計算機網絡體系結構分層

不難看出,TCP/IP 與 OSI 在分層模塊上稍有區別。OSI 參考模型注重“通信協議必要的功能是什麼”,而 TCP/IP 則更強調“在計算機上實現協議應該開發哪種程序”。二、 TCP/IP 基礎

1. TCP/IP 的具體含義

從字面意義上講,有人可能會認為 TCP/IP 是指 TCP 和 IP 兩種協議。實際生活當中有時也確實就是指這兩種協議。然而在很多情況下,它只是利用 IP 進行通信時所必須用到的協議群的統稱。具體來說,IP 或 ICMP、TCP 或 UDP、TELNET 或 FTP、以及 HTTP 等都屬於 TCP/IP 協議。他們與 TCP 或 IP 的關係緊密,是互聯網必不可少的組成部分。TCP/IP 一詞泛指這些協議,因此,有時也稱 TCP/IP 為網際協議群。

互聯網進行通信時,需要相應的網絡協議,TCP/IP 原本就是為使用互聯網而開發制定的協議族。因此,互聯網的協議就是 TCP/IP,TCP/IP 就是互聯網的協議。

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

網際協議群

2. 數據包

包、幀、數據包、段、消息

以上五個術語都用來表述數據的單位,大致區分如下:

  • 包可以說是全能性術語;
  • 幀用於表示數據鏈路層中包的單位;
  • 數據包是 IP 和 UDP 等網絡層以上的分層中包的單位;
  • 段則表示 TCP 數據流中的信息;
  • 消息是指應用協議中數據的單位。

每個分層中,都會對所發送的數據附加一個首部,在這個首部中包含了該層必要的信息,如發送的目標地址以及協議相關信息。通常,為協議提供的信息為包首部,所要發送的內容為數據。在下一層的角度看,從上一層收到的包全部都被認為是本層的數據。

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

數據包首部

網絡中傳輸的數據包由兩部分組成:一部分是協議所要用到的首部,另一部分是上一層傳過來的數據。首部的結構由協議的具體規範詳細定義。在數據包的首部,明確標明瞭協議應該如何讀取數據。反過來說,看到首部,也就能夠了解該協議必要的信息以及所要處理的數據。包首部就像協議的臉。

3. 數據處理流程

下圖以用戶 a 向用戶 b 發送郵件為例子:

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

數據處理流程

  • ① 應用程序處理
  • 首先應用程序會進行編碼處理,這些編碼相當於 OSI 的表示層功能;
  • 編碼轉化後,郵件不一定馬上被髮送出去,這種何時建立通信連接何時發送數據的管理功能,相當於 OSI 的會話層功能。
  • ② TCP 模塊的處理
  • TCP 根據應用的指示,負責建立連接、發送數據以及斷開連接。TCP 提供將應用層發來的數據順利發送至對端的可靠傳輸。為了實現這一功能,需要在應用層數據的前端附加一個 TCP 首部。
  • ③ IP 模塊的處理
  • IP 將 TCP 傳過來的 TCP 首部和 TCP 數據合起來當做自己的數據,並在 TCP 首部的前端加上自己的 IP 首部。IP 包生成後,參考路由控制表決定接受此 IP 包的路由或主機。
  • ④ 網絡接口(以太網驅動)的處理
  • 從 IP 傳過來的 IP 包對於以太網來說就是數據。給這些數據附加上以太網首部並進行發送處理,生成的以太網數據包將通過物理層傳輸給接收端。
  • ⑤ 網絡接口(以太網驅動)的處理
  • 主機收到以太網包後,首先從以太網包首部找到 MAC 地址判斷是否為發送給自己的包,若不是則丟棄數據。
  • 如果是發送給自己的包,則從以太網包首部中的類型確定數據類型,再傳給相應的模塊,如 IP、ARP 等。這裡的例子則是 IP 。
  • ⑥ IP 模塊的處理
  • IP 模塊接收到 數據後也做類似的處理。從包首部中判斷此 IP 地址是否與自己的 IP 地址匹配,如果匹配則根據首部的協議類型將數據發送給對應的模塊,如 TCP、UDP。這裡的例子則是 TCP。
  • 另外嗎,對於有路由器的情況,接收端地址往往不是自己的地址,此時,需要藉助路由控制表,在調查應該送往的主機或路由器之後再進行轉發數據。
  • ⑦ TCP 模塊的處理
  • 在 TCP 模塊中,首先會計算一下校驗和,判斷數據是否被破壞。然後檢查是否在按照序號接收數據。最後檢查端口號,確定具體的應用程序。數據被完整地接收以後,會傳給由端口號識別的應用程序。
  • ⑧ 應用程序的處理
  • 接收端應用程序會直接接收發送端發送的數據。通過解析數據,展示相應的內容。

三、傳輸層中的 TCP 和 UDP

TCP/IP 中有兩個具有代表性的傳輸層協議,分別是 TCP 和 UDP。

  • TCP 是面向連接的、可靠的流協議。流就是指不間斷的數據結構,當應用程序採用 TCP 發送消息時,雖然可以保證發送的順序,但還是猶如沒有任何間隔的數據流發送給接收端。TCP 為提供可靠性傳輸,實行“順序控制”或“重發控制”機制。此外還具備“流控制(流量控制)”、“擁塞控制”、提高網絡利用率等眾多功能。
  • UDP 是不具有可靠性的數據報協議。細微的處理它會交給上層的應用去完成。在 UDP 的情況下,雖然可以確保發送消息的大小,卻不能保證消息一定會到達。因此,應用有時會根據自己的需要進行重發處理。
  • TCP 和 UDP 的優缺點無法簡單地、絕對地去做比較:TCP 用於在傳輸層有必要實現可靠傳輸的情況;而在一方面,UDP 主要用於那些對高速傳輸和實時性有較高要求的通信或廣播通信。TCP 和 UDP 應該根據應用的目的按需使用。

1. 端口號

數據鏈路和 IP 中的地址,分別指的是 MAC 地址和 IP 地址。前者用來識別同一鏈路中不同的計算機,後者用來識別 TCP/IP 網絡中互連的主機和路由器。在傳輸層也有這種類似於地址的概念,那就是端口號。端口號用來識別同一臺計算機中進行通信的不同應用程序。因此,它也被稱為程序地址。

1.1 根據端口號識別應用

一臺計算機上同時可以運行多個程序。傳輸層協議正是利用這些端口號識別本機中正在進行通信的應用程序,並準確地將數據傳輸。

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

通過端口號識別應用

1.2 通過 IP 地址、端口號、協議號進行通信識別

  • 僅憑目標端口號識別某一個通信是遠遠不夠的。
上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

通過端口號、IP地址、協議號進行通信識別

  • ① 和② 的通信是在兩臺計算機上進行的。它們的目標端口號相同,都是80。這裡可以根據源端口號加以區分。
  • ③ 和 ① 的目標端口號和源端口號完全相同,但它們各自的源 IP 地址不同。
  • 此外,當 IP 地址和端口號全都一樣時,我們還可以通過協議號來區分(TCP 和 UDP)。

1.3 端口號的確定

  • 標準既定的端口號:這種方法也叫靜態方法。它是指每個應用程序都有其指定的端口號。但並不是說可以隨意使用任何一個端口號。例如 HTTP、FTP、TELNET 等廣為使用的應用協議中所使用的端口號就是固定的。這些端口號被稱為知名端口號,分佈在 0~1023 之間;除知名端口號之外,還有一些端口號被正式註冊,它們分佈在 1024~49151 之間,不過這些端口號可用於任何通信用途。
  • 時序分配法:服務器有必要確定監聽端口號,但是接受服務的客戶端沒必要確定端口號。在這種方法下,客戶端應用程序完全可以不用自己設置端口號,而全權交給操作系統進行分配。動態分配的端口號範圍在 49152~65535 之間。

1.4 端口號與協議

  • 端口號由其使用的傳輸層協議決定。因此,不同的傳輸層協議可以使用相同的端口號。
  • 此外,那些知名端口號與傳輸層協議並無關係。只要端口一致都將分配同一種應用程序進行處理。

2. UDP

  • UDP 不提供複雜的控制機制,利用 IP 提供面向無連接的通信服務。
  • 並且它是將應用程序發來的數據在收到的那一刻,立即按照原樣發送到網絡上的一種機制。即使是出現網絡擁堵的情況,UDP 也無法進行流量控制等避免網絡擁塞行為。
  • 此外,傳輸途中出現丟包,UDP 也不負責重發。
  • 甚至當包的到達順序出現亂序時也沒有糾正的功能。
  • 如果需要以上的細節控制,不得不交由採用 UDP 的應用程序去處理。
  • UDP 常用於一下
    幾個方面:1.包總量較少的通信(DNS、SNMP等);2.視頻、音頻等多媒體通信(即時通信);3.限定於 LAN 等特定網絡中的應用通信;4.廣播通信(廣播、多播)。

3. TCP

  • TCP 與 UDP 的區別相當大。它充分地實現了數據傳輸時各種控制功能,可以進行丟包時的重發控制,還可以對次序亂掉的分包進行順序控制。而這些在 UDP 中都沒有。
  • 此外,TCP 作為一種面向有連接的協議,只有在確認通信對端存在時才會發送數據,從而可以控制通信流量的浪費。
  • 根據 TCP 的這些機制,在 IP 這種無連接的網絡上也能夠實現高可靠性的通信( 主要通過檢驗和、序列號、確認應答、重發控制、連接管理以及窗口控制等機制實現)。

3.1 三次握手(重點)

  • TCP 提供面向有連接的通信傳輸。面向有連接是指在數據通信開始之前先做好兩端之間的準備工作。
  • 所謂三次握手是指建立一個 TCP 連接時需要客戶端和服務器端總共發送三個包以確認連接的建立。在socket編程中,這一過程由客戶端執行connect來觸發。

下面來看看三次握手的流程圖:

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

三次握手

  • 第一次握手:客戶端將標誌位SYN置為1,隨機產生一個值seq=J,並將該數據包發送給服務器端,客戶端進入SYN_SENT狀態,等待服務器端確認。
  • 第二次握手:服務器端收到數據包後由標誌位SYN=1知道客戶端請求建立連接,服務器端將標誌位SYN和ACK都置為1,ack=J+1,隨機產生一個值seq=K,並將該數據包發送給客戶端以確認連接請求,服務器端進入SYN_RCVD狀態。
  • 第三次握手:客戶端收到確認後,檢查ack是否為J+1,ACK是否為1,如果正確則將標誌位ACK置為1,ack=K+1,並將該數據包發送給服務器端,服務器端檢查ack是否為K+1,ACK是否為1,如果正確則連接建立成功,客戶端和服務器端進入ESTABLISHED狀態,完成三次握手,隨後客戶端與服務器端之間可以開始傳輸數據了。

3.2 四次揮手(重點)

  • 四次揮手即終止TCP連接,就是指斷開一個TCP連接時,需要客戶端和服務端總共發送4個包以確認連接的斷開。在socket編程中,這一過程由客戶端或服務端任一方執行close來觸發。
  • 由於TCP連接是全雙工的,因此,每個方向都必須要單獨進行關閉,這一原則是當一方完成數據發送任務後,發送一個FIN來終止這一方向的連接,收到一個FIN只是意味著這一方向上沒有數據流動了,即不會再收到數據了,但是在這個TCP連接上仍然能夠發送數據,直到這一方向也發送了FIN。首先進行關閉的一方將執行主動關閉,而另一方則執行被動關閉。

下面來看看四次揮手的流程圖:

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

四次揮手

  • 中斷連接端可以是客戶端,也可以是服務器端。
  • 第一次揮手:客戶端發送一個FIN=M,用來關閉客戶端到服務器端的數據傳送,客戶端進入FIN_WAIT_1狀態。意思是說"我客戶端沒有數據要發給你了",但是如果你服務器端還有數據沒有發送完成,則不必急著關閉連接,可以繼續發送數據。
  • 第二次揮手:服務器端收到FIN後,先發送ack=M+1,告訴客戶端,你的請求我收到了,但是我還沒準備好,請繼續你等我的消息。這個時候客戶端就進入FIN_WAIT_2 狀態,繼續等待服務器端的FIN報文。
  • 第三次揮手:當服務器端確定數據已發送完成,則向客戶端發送FIN=N報文,告訴客戶端,好了,我這邊數據發完了,準備好關閉連接了。服務器端進入LAST_ACK狀態。
  • 第四次揮手:客戶端收到FIN=N報文後,就知道可以關閉連接了,但是他還是不相信網絡,怕服務器端不知道要關閉,所以發送ack=N+1後進入TIME_WAIT狀態,如果Server端沒有收到ACK則可以重傳。服務器端收到ACK後,就知道可以斷開連接了。客戶端等待了2MSL後依然沒有收到回覆,則證明服務器端已正常關閉,那好,我客戶端也可以關閉連接了。最終完成了四次握手。

上面是一方主動關閉,另一方被動關閉的情況,實際中還會出現同時發起主動關閉的情況,

具體流程如下圖:

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

同時揮手

3.3 通過序列號與確認應答提高可靠性

  • 在 TCP 中,當發送端的數據到達接收主機時,接收端主機會返回一個已收到消息的通知。這個消息叫做確認應答(ACK)。當發送端將數據發出之後會等待對端的確認應答。如果有確認應答,說明數據已經成功到達對端。反之,則數據丟失的可能性很大
  • 在一定時間內沒有等待到確認應答,發送端就可以認為數據已經丟失,並進行重發。由此,即使產生了丟包,仍然能夠保證數據能夠到達對端,實現可靠傳輸。
  • 未收到確認應答並不意味著數據一定丟失。也有可能是數據對方已經收到,只是返回的確認應答在途中丟失。這種情況也會導致發送端誤以為數據沒有到達目的地而重發數據。
  • 此外,也有可能因為一些其他原因導致確認應答延遲到達,在源主機重發數據以後才到達的情況也屢見不鮮。此時,源主機只要按照機制重發數據即可。
  • 對於目標主機來說,反覆收到相同的數據是不可取的。為了對上層應用提供可靠的傳輸,目標主機必須放棄重複的數據包。為此我們引入了序列號。
  • 序列號是按照順序給發送數據的每一個字節(8位字節)都標上號碼的編號。接收端查詢接收數據 TCP 首部中的序列號和數據的長度,將自己下一步應該接收的序列號作為確認應答返送回去。通過序列號和確認應答號,TCP 能夠識別是否已經接收數據,又能夠判斷是否需要接收,從而實現可靠傳輸。
上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

序列號和確認應答

3.4 重發超時的確定

  • 重發超時是指在重發數據之前,等待確認應答到來的那個特定時間間隔。如果超過這個時間仍未收到確認應答,發送端將進行數據重發。最理想的是,找到一個最小時間,它能保證“確認應答一定能在這個時間內返回”。
  • TCP 要求不論處在何種網絡環境下都要提供高性能通信,並且無論網絡擁堵情況發生何種變化,都必須保持這一特性。為此,它在每次發包時都會計算往返時間及其偏差。將這個往返時間和偏差時間相加,重發超時的時間就是比這個總和要稍大一點的值。
  • 在 BSD 的 Unix 以及 Windows 系統中,超時都以0.5秒為單位進行控制,因此重發超時都是0.5秒的整數倍。不過,最初其重發超時的默認值一般設置為6秒左右。
  • 數據被重發之後若還是收不到確認應答,則進行再次發送。此時,等待確認應答的時間將會以2倍、4倍的指數函數延長。
  • 此外,數據也不會被無限、反覆地重發。達到一定重發次數之後,如果仍沒有任何確認應答返回,就會判斷為網絡或對端主機發生了異常,強制關閉連接。並且通知應用通信異常強行終止。

3.5 以段為單位發送數據

  • 在建立 TCP 連接的同時,也可以確定發送數據包的單位,我們也可以稱其為“最大消息長度”(MSS)。最理想的情況是,最大消息長度正好是 IP 中不會被分片處理的最大數據長度。
  • TCP 在傳送大量數據時,是以 MSS 的大小將數據進行分割發送。進行重發時也是以 MSS 為單位。
  • MSS 在三次握手的時候,在兩端主機之間被計算得出。兩端的主機在發出建立連接的請求時,會在 TCP 首部中寫入 MSS 選項,告訴對方自己的接口能夠適應的 MSS 的大小。然後會在兩者之間選擇一個較小的值投入使用。

3.6 利用窗口控制提高速度

  • TCP 以1個段為單位,每發送一個段進行一次確認應答的處理。這樣的傳輸方式有一個缺點,就是包的往返時間越長通信性能就越低。
  • 為解決這個問題,TCP 引入了窗口這個概念。確認應答不再是以每個分段,而是以更大的單位進行確認,轉發時間將會被大幅地縮短。也就是說,發送端主機,在發送了一個段以後不必要一直等待確認應答,而是繼續發送。如下圖所示:
上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)


  • 窗口控制
  • 窗口大小就是指無需等待確認應答而可以繼續發送數據的最大值。上圖中窗口大小為4個段。這個機制實現了使用大量的緩衝區,通過對多個段同時進行確認應答的功能。

3.7 滑動窗口控制

上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

滑動窗口

  • 上圖中的窗口內的數據即便沒有收到確認應答也可以被髮送出去。不過,在整個窗口的確認應答沒有到達之前,如果其中部分數據出現丟包,那麼發送端仍然要負責重傳。為此,發送端主機需要設置緩存保留這些待被重傳的數據,直到收到他們的確認應答。
  • 在滑動窗口以外的部分包括未發送的數據以及已經確認對端已收到的數據。當數據發出後若如期收到確認應答就可以不用再進行重發,此時數據就可以從緩存區清除。
  • 收到確認應答的情況下,將窗口滑動到確認應答中的序列號的位置。這樣可以順序地將多個段同時發送提高通信性能。這種機制也別稱為滑動窗口控制。

3.8 窗口控制中的重發控制

在使用窗口控制中, 出現丟包一般分為兩種情況:

  • ① 確認應答未能返回的情況。在這種情況下,數據已經到達對端,是不需要再進行重發的,如下圖:
上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

部分確認應答丟失

  • ② 某個報文段丟失的情況。接收主機如果收到一個自己應該接收的序列號以外的數據時,會針對當前為止收到數據返回確認應答。如下圖所示,當某一報文段丟失後,發送端會一直收到序號為1001的確認應答,因此,在窗口比較大,又出現報文段丟失的情況下,同一個序列號的確認應答將會被重複不斷地返回。而發送端主機如果連續3次收到同一個確認應答,就會將其對應的數據進行重發。這種機制比之前提到的超時管理更加高效,因此也被稱為高速重發控制。
上·一篇文章帶你熟悉 TCP/IP 協議(網絡協議篇二)

收藏查看下篇


分享到:


相關文章: