IP協議《入門到精通》面試常見題

tcp/ip基礎知識

背景及歷史

軍用技術

保證通信不中斷,分佈式通信誕生,分組交換技術誕生。

容災性較弱的中央集中式網絡:

帶你熟悉TCP/IP協議《入門到精通》面試常見題

容災性較強的分組網絡:

帶你熟悉TCP/IP協議《入門到精通》面試常見題

TCP/IP的誕生

1982年,TCP/IP具體規範最終定下來,並於1983年成為ARPANET網絡唯一指定協議。

2.2標準化

簡介:TCP/IP 是利用IP進行通信時所必須用到的協議群的統稱。

帶你熟悉TCP/IP協議《入門到精通》面試常見題

互聯網基礎

“互聯網”是指由ARPANET發展而來、互連全世界的計算機網絡。互聯網的協議就是TCP/IP。

結構: 互聯網中的每個網絡都是骨幹網(BackBone)和末端網(Stub)組成的。每個網絡之間通過NOC(網絡操作中心)相連。如果網絡運營商不同,它的網絡連接方式和使用方法也會不同。連接這種異構網絡需要IX的支持。總之,互聯網就是眾多異構的網絡通過IX互連的一個巨型網絡。

帶你熟悉TCP/IP協議《入門到精通》面試常見題

連接互聯網需要向ISP或區域網提出申請。

TCP/IP分層模型

TCP/IP與OSI參考模型:

帶你熟悉TCP/IP協議《入門到精通》面試常見題

硬件(物理層)

簡介:TCP/IP最底層負責數據傳輸的硬件。

網絡接口層(數據鏈路層)

簡介:網絡接口層利用以太網中數據鏈路層進行通信,因此屬於接口層。

互聯網層(網絡層)

簡介:互聯網層使用IP協議,它相當於OSI模型中的第3層網絡層。IP協議基於IP地址轉發分包數據。

IP:跨越網絡傳送數據包,使整個互聯網都能收到數據的協議。IP還隱含著數據鏈路的功能。通過IP,相互通信的主機之間不論經過怎樣的底層數據鏈路都能實現通信。雖然IP也是分組交換的一種協議,但是它不具有重發機制。即使分組數據包未能到達對端主機也不會重發。因此屬於非可靠性傳輸協議。

ICMP:IP數據包在發送途中一旦發生異常導致無法到達對端目標地址時,需要給發送一個異常的通知。ICMP就是為這一功能而制定的。診斷網絡健康。

互聯網協議入門

一、概述

1.1 五層模型

互聯網的實現,分成好幾層。每一層都有自己的功能,

用戶接觸到的,只是最上面的一層,要理解互聯網,必須從最下層開始,自下而上理解每一層的功能。

如何分層有不同的模型,有的模型分七層,有的分四層。我覺得,把互聯網分成五層,比較容易解釋。

最底下的一層叫做”實體層”(Physical Layer),最上面的一層叫做”應用層”(Application Layer),中間的三層(自下而上)分別是”鏈接層”(Link Layer)、”網絡層”(Network Layer)和”傳輸層”(Transport Layer)。越下面的層,越靠近硬件;越上面的層,越靠近用戶。

1.2 層與協議

每一層都是為了完成一種功能。為了實現這些功能,就需要大家都遵守共同的規則。

大家都遵守的規則,就叫做”協議”(protocol)。

都定義了很多協議。這些協議的總稱,就叫做”互聯網協議”(Internet Protocol Suite)。它們是互聯網的核心,

二、實體層

我們從最底下的一層開始。

第一件事要幹什麼?當然是先把電腦連起來,可以用光纜、電纜、雙絞線、無線電波等方式。

這就叫做”實體層”,它就是把電腦連接起來的物理手段。它主要規定了網絡的一些電氣特性,作用是負責傳送0和1的電信號。

三、鏈接層

3.1 定義

單純的0和1沒有任何意義,必須規定解讀方式:多少個電信號算一組?每個信號位有何意義?

這就是”鏈接層”的功能,

3.2 以太網協議

每家公司都有自己的電信號分組方式。逐漸地,一種叫做“以太網”(Ethernet)的協議,佔據了主導地位。

以太網規定,一組電信號構成一個數據包,叫做”幀”(Frame)。每一幀分成兩個部分:標頭(Head)和數據(Data)。

“標頭”包含數據包的一些說明項,比如發送者、接受者、數據類型等等;”數據”則是數據包的具體內容。

“標頭”的長度,固定為18字節。”數據”的長度,最短為46字節,最長為1500字節。因此,整個”幀”最短為64字節,最長為1518字節。如果數據很長,就必須分割成多個幀進行發送。

3.3 MAC地址

以太網數據包的”標頭”,包含了發送者和接受者的信息。那麼,發送者和接受者是如何標識呢?

以太網規定,連入網絡的所有設備,都必須具有”網卡”接口。數據包必須是從一塊網卡,傳送到另一塊網卡。網卡的地址,就是數據包的發送地址和接收地址,這叫做MAC地址。

MAC地址,長度是48個二進制位,通常用12個十六進制數表示。

前6個十六進制數是廠商編號,後6個是該廠商的網卡流水號。有了MAC地址,就可以定位網卡和數據包的路徑了。

3.4 廣播

定義地址只是第一步,後面還有更多的步驟。

首先,一塊網卡怎麼會知道另一塊網卡的MAC地址?

回答是有一種ARP協議,可以解決這個問題。這個留到後面介紹,這裡只需要知道,以太網數據包必須知道接收方的MAC地址,然後才能發送。

其次,就算有了MAC地址,系統怎樣才能把數據包準確送到接收方?

以太網採用了一種很”原始”的方式,它不是把數據包準確送到接收方,而是向本網絡內所有計算機發送,讓每臺計算機自己判斷,是否為接收方。

1號計算機向2號計算機發送一個數據包,同一個子網絡的3號、4號、5號計算機都會收到這個包。它們讀取這個包的”標頭”,找到接收方的MAC地址,然後與自身的MAC地址相比較,如果兩者相同,就接受這個包,做進一步處理,否則就丟棄這個包。這種發送方式就叫做”廣播”(broadcasting)。

有了數據包的定義、網卡的MAC地址、廣播的發送方式,”鏈接層”就可以在多臺計算機之間傳送數據了。

四、網絡層

4.1 網絡層的由來

以太網協議,依靠MAC地址發送數據。理論上,單單依靠MAC地址,上海的網卡就可以找到洛杉磯的網卡了,技術上是可以實現的。

以太網採用廣播方式發送數據包,所有成員人手一”包”,不僅效率低,而且侷限在發送者所在的子網絡。也就是說,如果兩臺計算機不在同一個子網絡,廣播是傳不過去的。這種設計是合理的,否則互聯網上每一臺計算機都會收到所有包,那會引起災難。

因此,必須找到一種方法,能夠區分哪些MAC地址屬於同一個子網絡,哪些不是。如果是同一個子網絡,就採用廣播方式發送,否則就採用”路由”方式發送。(”路由”的意思,就是指如何向不同的子網絡分發數據包,這是一個很大的主題,本文不涉及。)遺憾的是,MAC地址本身無法做到這一點。它只與廠商有關,與所處網絡無關。

這就導致了”網絡層”的誕生。它的作用是引進一套新的地址,使得我們能夠區分不同的計算機是否屬於同一個子網絡。這套地址就叫做”網絡地址”,簡稱”網址”。

於是,”網絡層”出現以後,每臺計算機有了兩種地址,一種是MAC地址,另一種是網絡地址。兩種地址之間沒有任何聯繫,MAC地址是綁定在網卡上的,網絡地址則是管理員分配的,它們只是隨機組合在一起。

網絡地址幫助我們確定計算機所在的子網絡,MAC地址則將數據包送到該子網絡中的目標網卡。因此,從邏輯上可以推斷,必定是先處理網絡地址,然後再處理MAC地址。

4.2 IP協議

規定網絡地址的協議,叫做IP協議。它所定義的地址,就被稱為IP地址。

我們用分成四段的十進制數表示IP地址,從0.0.0.0一直到255.255.255.255。

互聯網上的每一臺計算機,都會分配到一個IP地址。這個地址分成兩個部分,前一部分代表網絡,後一部分代表主機。比如,IP地址172.16.254.1,這是一個32位的地址,假定它的網絡部分是前24位(172.16.254),那麼主機部分就是後8位(最後的那個1)。處於同一個子網絡的電腦,它們IP地址的網絡部分必定是相同的,也就是說172.16.254.2應該與172.16.254.1處在同一個子網絡。

問題在於單單從IP地址,我們無法判斷網絡部分。還是以172.16.254.1為例,它的網絡部分,到底是前24位,還是前16位,甚至前28位,從IP地址上是看不出來的。

那麼,怎樣才能從IP地址,判斷兩臺計算機是否屬於同一個子網絡呢?這就要用到另一個參數”子網掩碼”(subnet mask)。

”子網掩碼”,就是表示子網絡特徵的一個參數。它在形式上等同於IP地址,也是一個32位二進制數字,它的網絡部分全部為1,主機部分全部為0。比如,IP地址172.16.254.1,如果已知網絡部分是前24位,主機部分是後8位,那麼子網絡掩碼就是11111111.11111111.11111111.00000000,寫成十進制就是255.255.255.0。

知道”子網掩碼”,我們就能判斷,任意兩個IP地址是否處在同一個子網絡。方法是將兩個IP地址與子網掩碼分別進行AND運算(兩個數位都為1,運算結果為1,否則為0),然後比較結果是否相同,如果是的話,就表明它們在同一個子網絡中,否則就不是。

總結一下,IP協議的作用主要有兩個,一個是為每一臺計算機分配IP地址,另一個是確定哪些地址在同一個子網絡。

4.3 IP數據包

根據IP協議發送的數據,就叫做IP數據包。不難想象,其中必定包括IP地址信息。

但是前面說過,以太網數據包只包含MAC地址,並沒有IP地址的欄位。那麼是否需要修改數據定義,再添加一個欄位呢?

回答是不需要,我們可以把IP數據包直接放進以太網數據包的”數據”部分,因此完全不用修改以太網的規格。這就是互聯網分層結構的好處:上層的變動完全不涉及下層的結構。

具體來說,IP數據包也分為”標頭”和”數據”兩個部分。

“標頭”部分主要包括版本、長度、IP地址等信息,”數據”部分則是IP數據包的具體內容。它放進以太網數據包後,以太網數據包就變成了下面這樣。

IP數據包的”標頭”部分的長度為20到60字節,整個數據包的總長度最大為65,535字節。因此,理論上,一個IP數據包的”數據”部分,最長為65,515字節。前面說過,以太網數據包的”數據”部分,最長只有1500字節。因此,如果IP數據包超過了1500字節,它就需要分割成幾個以太網數據包,分開發送了。

4.4 ARP協議

關於”網絡層”,還有最後一點需要說明。

因為IP數據包是放在以太網數據包裡發送的,所以我們必須同時知道兩個地址,一個是對方的MAC地址,另一個是對方的IP地址。通常情況下,對方的IP地址是已知的(後文會解釋),但是我們不知道它的MAC地址。

所以,我們需要一種機制,能夠從IP地址得到MAC地址。

這裡又可以分成兩種情況。第一種情況,如果兩臺主機不在同一個子網絡,那麼事實上沒有辦法得到對方的MAC地址,只能把數據包傳送到兩個子網絡連接處的”網關”(gateway),讓網關去處理。

第二種情況,如果兩臺主機在同一個子網絡,那麼我們可以用ARP協議,得到對方的MAC地址。ARP協議也是發出一個數據包(包含在以太網數據包中),其中包含它所要查詢主機的IP地址,在對方的MAC地址這一欄,填的是FF:FF:FF:FF:FF:FF,表示這是一個”廣播”地址。它所在子網絡的每一臺主機,都會收到這個數據包,從中取出IP地址,與自身的IP地址進行比較。如果兩者相同,都做出回覆,向對方報告自己的MAC地址,否則就丟棄這個包。

總之,有了ARP協議之後,我們就可以得到同一個子網絡內的主機MAC地址,可以把數據包發送到任意一臺主機之上了。

五、傳輸層

5.1 傳輸層的由來

有了MAC地址和IP地址,我們已經可以在互聯網上任意兩臺主機上建立通信。

接下來的問題是,同一臺主機上有許多程序都需要用到網絡,比如,你一邊瀏覽網頁,一邊與朋友在線聊天。當一個數據包從互聯網上發來的時候,你怎麼知道,它是表示網頁的內容,還是表示在線聊天的內容?

也就是說,我們還需要一個參數,表示這個數據包到底供哪個程序(進程)使用。這個參數就叫做”端口”(port),它其實是每一個使用網卡的程序的編號。每個數據包都發到主機的特定端口,所以不同的程序就能取到自己所需要的數據。

“端口”是0到65535之間的一個整數,正好16個二進制位。0到1023的端口被系統佔用,用戶只能選用大於1023的端口。不管是瀏覽網頁還是在線聊天,應用程序會隨機選用一個端口,然後與服務器的相應端口聯繫。

“傳輸層”的功能,就是建立”端口到端口”的通信。相比之下,”網絡層”的功能是建立”主機到主機”的通信。只要確定主機和端口,我們就能實現程序之間的交流。因此,Unix系統就把主機+端口,叫做”套接字”(socket)。有了它,就可以進行網絡應用程序開發了。

5.2 UDP協議

現在,我們必須在數據包中加入端口信息,這就需要新的協議。最簡單的實現叫做UDP協議,它的格式幾乎就是在數據前面,加上端口號。

UDP數據包,也是由”標頭”和”數據”兩部分組成。

“標頭”部分主要定義了發出端口和接收端口,”數據”部分就是具體的內容。然後,把整個UDP數據包放入IP數據包的”數據”部分,而前面說過,IP數據包又是放在以太網數據包之中的,所以整個以太網數據包現在變成了下面這樣:

UDP數據包非常簡單,”標頭”部分一共只有8個字節,總長度不超過65,535字節,正好放進一個IP數據包。

5.3 TCP協議

UDP協議的優點是比較簡單,容易實現,但是缺點是可靠性較差,一旦數據包發出,無法知道對方是否收到。

為了解決這個問題,提高網絡可靠性,TCP協議就誕生了。這個協議非常複雜,但可以近似認為,它就是有確認機制的UDP協議,每發出一個數據包都要求確認。如果有一個數據包遺失,就收不到確認,發出方就知道有必要重發這個數據包了。

因此,TCP協議能夠確保數據不會遺失。它的缺點是過程複雜、實現困難、消耗較多的資源。

TCP數據包和UDP數據包一樣,都是內嵌在IP數據包的”數據”部分。TCP數據包沒有長度限制,理論上可以無限長,但是為了保證網絡的效率,通常TCP數據包的長度不會超過IP數據包的長度,以確保單個TCP數據包不必再分割。

TCP/IP協議

TCP/IP不是一個協議,而是一個協議族的統稱。裡面包括IP協議、IMCP協議、TCP協議。

TCP/IP分層:

帶你熟悉TCP/IP協議《入門到精通》面試常見題

這裡有幾個需要注意的知識點:

互聯網地址:也就是IP地址,一般為網絡號+子網號+主機號

域名系統:通俗的來說,就是一個數據庫,可以將主機名轉換成IP地址

RFC:TCP/IP協議的標準文檔

端口號:一個邏輯號碼,IP包所帶有的標記

Socket:應用編程接口

數據鏈路層的工作特性:

為IP模塊發送和接收IP數據報

為ARP模塊發送ARP請求和接收ARP應答(ARP:地址解析協議,將IP地址轉換成MAC地址)

為RARP發送RARP請求和接收RARP應答

接下來我們瞭解一下TCP/IP的工作流程:

數據鏈路層從ARP得到數據的傳遞信息,再從IP得到具體的數據信息

IP協議

帶你熟悉TCP/IP協議《入門到精通》面試常見題

IP協議頭當中,最重要的就是TTL(IP允許通過的最大網段數量)字段(八位),規定該數據包能穿過幾個路由之後才會被拋棄。

IP路由選擇

帶你熟悉TCP/IP協議《入門到精通》面試常見題

ARP協議工作原理

帶你熟悉TCP/IP協議《入門到精通》面試常見題

ICMP協議(網絡控制文協議)

將IP數據包不能傳送的錯誤信息傳送給主機

查詢報文

ping查詢:主機是否可達,通過計算間隔時間和傳送多少個包的數量

子網掩碼

時間戳:獲得當前時間

差錯報文

不產生的情況:

ICMP差錯報文不產生差錯報文

源地址為零地址、環目地址、廣播地址、多播地址

IP路由器選擇協議

靜態路由選擇

先來看路由選擇工作流程:

帶你熟悉TCP/IP協議《入門到精通》面試常見題

靜態路由選擇

配置接口以默認方式生成路由表項,或者使用route add手動添加表項

ICMP報文(ICMP重定向報文)更新表項

動態路由選擇(只使用在路由之間)

RIP(路由信息協議)

分佈式的基於距離向量(路由器到每一個目的網絡的距離記錄)的路由選擇協議

router承擔的工作:

給每一個已知路由器發送RIP請求報文,要求給出完整的路由表

如果接受請求,就將自己的路由表交給請求者;如果沒有,就處理IP請求表項(自己部分+跳數/沒有的部分+16)

接受回應,更新路由表

定期更新路由表(一般為30s,只能說太頻繁~)

OSPF(開放最短路徑優先協議)

分佈式鏈路狀態(和這兩個路由器都有接口的網絡)協議

當鏈路狀態發生變化時,採用可靠的洪泛法,向所有的路由器發送信息(相鄰的所有路由器的鏈路狀態)

最終會建立一個全網的拓撲結構圖

TCP/IP的三次握手,四次分手

首先我們先來了解TCP報文段

帶你熟悉TCP/IP協議《入門到精通》面試常見題

重要的標誌我在圖中也有標記,重點了解標誌位

ACK:確認序號有效

RST:重置連接

SYN:發起了一個新連接

FIN:釋放一個連接

三次握手的過程(客戶端我們用A表示,服務器端用B表示)

前提:A主動打開,B被動打開

帶你熟悉TCP/IP協議《入門到精通》面試常見題

在建立連接之前,B先創建TCB(傳輸控制塊),準備接受客戶進程的連接請求,處於LISTEN(監聽)狀態

A首先創建TCB,然後向B發出連接請求,SYN置1,同時選擇初始序號seq=x,進入SYN-SEND(同步已發送)狀態

B收到連接請求後向A發送確認,SYN置1,ACK置1,同時產生一個確認序號ack=x+1。同時隨機選擇初始序號seq=y,進入SYN-RCVD(同步收到)狀態

A收到確認連接請求後,ACK置1,確認號ack=y+1,seq=x+1,進入到ESTABLISHED(已建立連接)狀態。向B發出確認連接,最後B也進入到ESTABLISHED(已建立連接)狀態。

簡單來說,就是

建立連接時,客戶端發送SYN包(SYN=i)到服務器,並進入到SYN-SEND狀態,等待服務器確認

服務器收到SYN包,必須確認客戶的SYN(ack=i+1),同時自己也發送一個SYN包(SYN=k),即SYN+ACK包,此時服務器進入SYN-RECV狀態

客戶端收到服務器的SYN+ACK包,向服務器發送確認報ACK(ack=k+1),此包發送完畢,客戶端和服務器進入ESTABLISHED狀態,完成三次握手

在此穿插一個知識點就是SYN攻擊,那麼什麼是SYN攻擊?發生的條件是什麼?怎麼避免?

在三次握手過程中,Server發送SYN-ACK之後,收到Client的ACK之前的TCP連接稱為半連接(half-open connect),此時Server處於SYN_RCVD狀態,當收到ACK後,Server轉入ESTABLISHED狀態。SYN攻擊就是 Client在短時間內偽造大量不存在的IP地址,並向Server不斷地發送SYN包,Server回覆確認包,並等待Client的確認,由於源地址 是不存在的,因此,Server需要不斷重發直至超時,這些偽造的SYN包將產時間佔用未連接隊列,導致正常的SYN請求因為隊列滿而被丟棄,從而引起網 絡堵塞甚至系統癱瘓。SYN攻擊時一種典型的DDOS攻擊,檢測SYN攻擊的方式非常簡單,即當Server上有大量半連接狀態且源IP地址是隨機的,則可以斷定遭到SYN攻擊了,使用如下命令可以讓之現行:

#netstat -nap | grep SYN_RECV

四次分手的過程(客戶端我們用A表示,服務器端用B表示)

由於TCP連接時是全雙工的,因此每個方向都必須單獨進行關閉。這一原則是當一方完成數據發送任務後,發送一個FIN來終止這一方向的鏈接。收到一個FIN只是意味著這一方向上沒有數據流動,既不會在收到數據,但是在這個TCP連接上仍然能夠發送數據,知道這一方向也發送了FIN,首先進行關閉的一方將執行主動關閉,而另一方則執行被動關閉。

前提:A主動關閉,B被動關閉

帶你熟悉TCP/IP協議《入門到精通》面試常見題

A發送一個FIN,用來關閉A到B的數據傳送,A進入FIN_WAIT_1狀態。

B收到FIN後,發送一個ACK給A,確認序號為收到序號+1(與SYN相同,一個FIN佔用一個序號),B進入CLOSE_WAIT狀態。

B發送一個FIN,用來關閉B到A的數據傳送,B進入LAST_ACK狀態。

A收到FIN後,A進入TIME_WAIT狀態,接著發送一個ACK給B,確認序號為收到序號+1,B進入CLOSED狀態,完成四次揮手。

簡單來說就是

一;客戶端A發送一個FIN,用來關閉客戶A到服務器B的數據傳送(報文段4)。

二;服務器B收到這個FIN,它發回一個ACK,確認序號為收到的序號加1(報文段5)。和SYN一樣,一個FIN將佔用一個序號。

三;服務器B關閉與客戶端A的連接,發送一個FIN給客戶端A(報文段6)。

四;客戶端A發回ACK報文確認,並將確認序號設置為收到序號加1(報文段7)。

A在進入到TIME-WAIT狀態後,並不會馬上釋放TCP,必須經過時間等待計時器設置的時間2MSL(最長報文段壽命),A才進入到CLOSED狀態。為了保證A發送的最後一個ACK報文段能夠到達B

防止“已失效的連接請求報文段”出現在本連接中

OK~是不是很難懂的感覺?那就私信我吧。;資料;

注;C/C++ Linux服務器開發學習資料私信“資料”,直接領取全套資料


分享到:


相關文章: