SpringCloud註冊中心之Eureka, Zookeeper, Nacos

分佈式理論基礎 CAP理論指出,一個分佈式系統不可能同時滿足C(一致性)、A(可用性)和P(分區容錯性)。由於分區容錯性在是分佈式系統中必須要保證的,因此我們只能在A和C之間進行權衡。

一、常用的註冊中心對比

Zookeeper、Eureka、Consul、Etcd、Nacos,其中Zookeeper、Consul、Etcd 保證CP;Eureka保證AP;Nacos對CP、AP都支持。和SpringCloud集成最好的是Eureka、Consul。

SpringCloud註冊中心之Eureka, Zookeeper, Nacos

二、Zookeeper 保證 CP

當向註冊中心查詢服務列表時,我們可以容忍註冊中心返回的是幾分鐘以前的註冊信息,但不能接受服務直接down掉不可用。也就是說,服務註冊功能對可用性的要求要高於一致性。

SpringCloud註冊中心之Eureka, Zookeeper, Nacos

但是zk會出現這樣一種情況,當master節點因為網絡故障與其他節點失去聯繫時,剩餘節點會重新進行leader選舉。問題在於,選舉leader的時間太長,30 ~ 120s, 且選舉期間整個zk集群都是不可用的,這就導致在選舉期間註冊服務癱瘓。在雲部署的環境下,因網絡問題使得zk集群失去master節點是較大概率會發生的事,雖然服務能夠最終恢復,但是漫長的選舉時間導致的註冊長期不可用是不能容忍的。

三、Eureka 保證 AP

Eureka看明白了這一點,因此在設計時就優先保證可用性。Eureka各個節點都是平等的,幾個節點掛掉不會影響正常節點的工作,剩餘的節點依然可以提供註冊和查詢服務。而Eureka的客戶端在向某個Eureka註冊或時如果發現連接失敗,則會自動切換至其它節點,只要有一臺Eureka還在,就能保證註冊服務可用(保證可用性),只不過查到的信息可能不是最新的(不保證強一致性)。

SpringCloud註冊中心之Eureka, Zookeeper, Nacos

除此之外,Eureka還有一種自我保護機制,如果在15分鐘內超過85%的節點都沒有正常的心跳,那麼Eureka就認為客戶端與註冊中心出現了網絡故障,此時會出現以下幾種情況:

  1. Eureka不再從註冊列表中移除因為長時間沒收到心跳而應該過期的服務。
  2. Eureka仍然能夠接受新服務的註冊和查詢請求,但是不會被同步到其它節點上(即保證當前節點依然可用) 。
  3. 當網絡穩定時,當前實例新的註冊信息會被同步到其它節點中。

因此, Eureka可以很好的應對因網絡故障導致部分節點失去聯繫的情況,而不會像zookeeper那樣使整個註冊服務癱瘓。

四、Nacos

Nacos 同時支持AP和CP模式,她根據服務註冊選擇臨時和永久來決定走AP模式還是CP模式。一般情況下,作為集群的配置中心(類似Zookeeper),適用CP模式;作為集群的註冊中心(類似Eureka),適用AP模式。

SpringCloud註冊中心之Eureka, Zookeeper, Nacos

Nacos 作為後起之秀,性能非常優越。由於Eureka2.0版本後不再更新,Nacos不失為一種優秀的替代選擇。

五、Eureka vs Zookeeper

Zookeeper保證的是CP,而Eureka則是AP。Eureka作為單純的服務註冊中心來說要比zookeeper更加“專業”,因為註冊服務更重要的是可用性,我們可以接受短期內達不到一致性的狀況。


分享到:


相關文章: