哎呀！原來這才是 Kafka！（多圖+深入）

2019-03-15 08:43:43 Java芋道源碼

簡介
生產
消費
消息投遞語義
文件組織
常用配置項

簡介

kafka是一個分佈式消息隊列。具有高性能、持久化、多副本備份、橫向擴展能力。生產者往隊列裡寫消息，消費者從隊列裡取消息進行業務邏輯。一般在架構設計中起到解耦、削峰、異步處理的作用。

kafka對外使用topic的概念，生產者往topic裡寫消息，消費者從讀消息。為了做到水平擴展，一個topic實際是由多個partition組成的，遇到瓶頸時，可以通過增加partition的數量來進行橫向擴容。單個parition內是保證消息有序。

每新寫一條消息，kafka就是在對應的文件append寫，所以性能非常高。

kafka的總體數據流是這樣的：

kafka data flow

大概用法就是，Producers往Brokers裡面的指定Topic中寫消息，Consumers從Brokers裡面拉去指定Topic的消息，然後進行業務處理。

圖中有兩個topic，topic 0有兩個partition，topic 1有一個partition，三副本備份。可以看到consumer gourp 1中的consumer 2沒有分到partition處理，這是有可能出現的，下面會講到。

關於broker、topics、partitions的一些元信息用zk來存，監控和路由啥的也都會用到zk。

生產

基本流程是這樣的：

kafka sdk product flow.png

創建一條記錄，記錄中一個要指定對應的topic和value，key和partition可選。先序列化，然後按照topic和partition，放進對應的發送隊列中。kafka produce都是批量請求，會積攢一批，然後一起發送，不是調send()就進行立刻進行網絡發包。

如果partition沒填，那麼情況會是這樣的：

key有填
按照key進行哈希，相同key去一個partition。（如果擴展了partition的數量那麼就不能保證了）
key沒填
round-robin來選partition

這些要發往同一個partition的請求按照配置，攢一波，然後由一個單獨的線程一次性發過去。

API

有high level api，替我們把很多事情都幹了，offset，路由啥都替我們幹了，用以來很簡單。

還有simple api，offset啥的都是要我們自己記錄。

partition

當存在多副本的情況下，會盡量把多個副本，分配到不同的broker上。kafka會為partition選出一個leader，之後所有該partition的請求，實際操作的都是leader，然後再同步到其他的follower。當一個broker歇菜後，所有leader在該broker上的partition都會重新選舉，選出一個leader。（這裡不像分佈式文件存儲系統那樣會自動進行復制保持副本數）

然後這裡就涉及兩個細節：怎麼分配partition，怎麼選leader。

關於partition的分配，還有leader的選舉，總得有個執行者。在kafka中，這個執行者就叫controller。kafka使用zk在broker中選出一個controller，用於partition分配和leader選舉。

partition的分配

將所有Broker（假設共n個Broker）和待分配的Partition排序
將第i個Partition分配到第（i mod n）個Broker上（這個就是leader）
將第i個Partition的第j個Replica分配到第（(i + j) mode n）個Broker上

leader容災

controller會在Zookeeper的/brokers/ids節點上註冊Watch，一旦有broker宕機，它就能知道。當broker宕機後，controller就會給受到影響的partition選出新leader。controller從zk的/brokers/topics/[topic]/partitions/[partition]/state中，讀取對應partition的ISR（in-sync replica已同步的副本）列表，選一個出來做leader。

選出leader後，更新zk，然後發送LeaderAndISRRequest給受影響的broker，讓它們改變知道這事。為什麼這裡不是使用zk通知，而是直接給broker發送rpc請求，我的理解可能是這樣做zk有性能問題吧。

如果ISR列表是空，那麼會根據配置，隨便選一個replica做leader，或者乾脆這個partition就是歇菜。如果ISR列表的有機器，但是也歇菜了，那麼還可以等ISR的機器活過來。

多副本同步

這裡的策略，服務端這邊的處理是follower從leader批量拉取數據來同步。但是具體的可靠性，是由生產者來決定的。

生產者生產消息的時候，通過request.required.acks參數來設置數據的可靠性。

ackswhat happen0which means that the producer never waits for an acknowledgement from the broker.發過去就完事了，不關心broker是否處理成功，可能丟數據。1which means that the producer gets an acknowledgement after the leader replica has received the data. 當寫Leader成功後就返回,其他的replica都是通過fetcher去同步的,所以kafka是異步寫，主備切換可能丟數據。-1which means that the producer gets an acknowledgement after all in-sync replicas have received the data. 要等到isr裡所有機器同步成功，才能返回成功，延時取決於最慢的機器。強一致，不會丟數據。

在acks=-1的時候，如果ISR少於min.insync.replicas指定的數目，那麼就會返回不可用。

這裡ISR列表中的機器是會變化的，根據配置replica.lag.time.max.ms，多久沒同步，就會從ISR列表中剔除。以前還有根據落後多少條消息就踢出ISR，在1.0版本後就去掉了，因為這個值很難取，在高峰的時候很容易出現節點不斷的進出ISR列表。

從ISA中選出leader後，follower會從把自己日誌中上一個高水位後面的記錄去掉，然後去和leader拿新的數據。因為新的leader選出來後，follower上面的數據，可能比新leader多，所以要截取。這裡高水位的意思，對於partition和leader，就是所有ISR中都有的最新一條記錄。消費者最多隻能讀到高水位；

從leader的角度來說高水位的更新會延遲一輪，例如寫入了一條新消息，ISR中的broker都fetch到了，但是ISR中的broker只有在下一輪的fetch中才能告訴leader。

也正是由於這個高水位延遲一輪，在一些情況下，kafka會出現丟數據和主備數據不一致的情況，0.11開始，使用leader epoch來代替高水位。（https://cwiki.apache.org/confluence/display/KAFKA/KIP-101+-+Alter+Replication+Protocol+to+use+Leader+Epoch+rather+than+High+Watermark+for+Truncation#KIP-101-AlterReplicationProtocoltouseLeaderEpochratherthanHighWatermarkforTruncation-Scenario1:HighWatermarkTruncationfollowedbyImmediateLeaderElection）

思考：

當acks=-1時

是follwers都來fetch就返回成功，還是等follwers第二輪fetch？
leader已經寫入本地，但是ISR中有些機器失敗，那麼怎麼處理呢？

消費

訂閱topic是以一個消費組來訂閱的，一個消費組裡面可以有多個消費者。同一個消費組中的兩個消費者，不會同時消費一個partition。換句話來說，就是一個partition，只能被消費組裡的一個消費者消費，但是可以同時被多個消費組消費。因此，如果消費組內的消費者如果比partition多的話，那麼就會有個別消費者一直空閒。

untitled_page.png

API

訂閱topic時，可以用正則表達式，如果有新topic匹配上，那能自動訂閱上。

offset的保存

一個消費組消費partition，需要保存offset記錄消費到哪，以前保存在zk中，由於zk的寫性能不好，以前的解決方法都是consumer每隔一分鐘上報一次。這裡zk的性能嚴重影響了消費的速度，而且很容易出現重複消費。

在0.10版本後，kafka把這個offset的保存，從zk總剝離，保存在一個名叫__consumeroffsets topic的topic中。寫進消息的key由groupid、topic、partition組成，value是偏移量offset。topic配置的清理策略是compact。總是保留最新的key，其餘刪掉。一般情況下，每個key的offset都是緩存在內存中，查詢的時候不用遍歷partition，如果沒有緩存，第一次就會遍歷partition建立緩存，然後查詢返回。

確定consumer group位移信息寫入__consumers_offsets的哪個partition，具體計算公式：

__consumers_offsets partition =
 Math.abs(groupId.hashCode() % groupMetadataTopicPartitionCount) 
//groupMetadataTopicPartitionCount由offsets.topic.num.partitions指定，默認是50個分區。

思考：

如果正在跑的服務，修改了offsets.topic.num.partitions，那麼offset的保存是不是就亂套了？

分配partition--reblance

生產過程中broker要分配partition，消費過程這裡，也要分配partition給消費者。類似broker中選了一個controller出來，消費也要從broker中選一個coordinator，用於分配partition。

下面從頂向下，分別闡述一下

怎麼選coordinator。
交互流程。
reblance的流程。

選coordinator

看offset保存在那個partition
該partition leader所在的broker就是被選定的coordinator

這裡我們可以看到，consumer group的coordinator，和保存consumer group offset的partition leader是同一臺機器。

交互流程

把coordinator選出來之後，就是要分配了

整個流程是這樣的：

consumer啟動、或者coordinator宕機了，consumer會任意請求一個broker，發送ConsumerMetadataRequest請求，broker會按照上面說的方法，選出這個consumer對應coordinator的地址。
consumer 發送heartbeat請求給coordinator，返回IllegalGeneration的話，就說明consumer的信息是舊的了，需要重新加入進來，進行reblance。返回成功，那麼consumer就從上次分配的partition中繼續執行。

reblance流程

consumer給coordinator發送JoinGroupRequest請求。
這時其他consumer發heartbeat請求過來時，coordinator會告訴他們，要reblance了。
其他consumer發送JoinGroupRequest請求。
所有記錄在冊的consumer都發了JoinGroupRequest請求之後，coordinator就會在這裡consumer中隨便選一個leader。然後回JoinGroupRespone，這會告訴consumer你是follower還是leader，對於leader，還會把follower的信息帶給它，讓它根據這些信息去分配partition

5、consumer向coordinator發送SyncGroupRequest，其中leader的SyncGroupRequest會包含分配的情況。

6、coordinator回包，把分配的情況告訴consumer，包括leader。

當partition或者消費者的數量發生變化時，都得進行reblance。

列舉一下會reblance的情況：

增加partition
增加消費者
消費者主動關閉
消費者宕機了
coordinator自己也宕機了

消息投遞語義

kafka支持3種消息投遞語義

At most once：最多一次，消息可能會丟失，但不會重複

At least once：最少一次，消息不會丟失，可能會重複

Exactly once：只且一次，消息不丟失不重複，只且消費一次（0.11中實現，僅限於下游也是kafka）

在業務中，常常都是使用At least once的模型，如果需要可重入的話，往往是業務自己實現。

At least once

先獲取數據，再進行業務處理，業務處理成功後commit offset。

1、生產者生產消息異常，消息是否成功寫入不確定，重做，可能寫入重複的消息

2、消費者處理消息，業務處理成功後，更新offset失敗，消費者重啟的話，會重複消費

At most once

先獲取數據，再commit offset，最後進行業務處理。

1、生產者生產消息異常，不管，生產下一個消息，消息就丟了

2、消費者處理消息，先更新offset，再做業務處理，做業務處理失敗，消費者重啟，消息就丟了

Exactly once

思路是這樣的，首先要保證消息不丟，再去保證不重複。所以盯著At least once的原因來搞。首先想出來的：

生產者重做導致重複寫入消息----生產保證冪等性
消費者重複消費---消滅重複消費，或者業務接口保證冪等性重複消費也沒問題

由於業務接口是否冪等，不是kafka能保證的，所以kafka這裡提供的exactly once是有限制的，消費者的下游也必須是kafka。所以一下討論的，沒特殊說明，消費者的下游系統都是kafka（注:使用kafka conector，它對部分系統做了適配，實現了exactly once）。

生產者冪等性好做，沒啥問題。

解決重複消費有兩個方法：

下游系統保證冪等性，重複消費也不會導致多條記錄。
把commit offset和業務處理綁定成一個事務。

本來exactly once實現第1點就ok了。

但是在一些使用場景下，我們的數據源可能是多個topic，處理後輸出到多個topic，這時我們會希望輸出時要麼全部成功，要麼全部失敗。

這就需要實現事務性。既然要做事務，那麼幹脆把重複消費的問題從根源上解決，把commit offset和輸出到其他topic綁定成一個事務。

生產冪等性

思路是這樣的，為每個producer分配一個pid，作為該producer的唯一標識。producer會為每一個維護一個單調遞增的seq。類似的，broker也會為每個記錄下最新的seq。當req_seq == broker_seq+1時，broker才會接受該消息。因為：

消息的seq比broker的seq大超過時，說明中間有數據還沒寫入，即亂序了。
消息的seq不比broker的seq小，那麼說明該消息已被保存。

解決重複生產

事務性/原子性廣播

場景是這樣的：

先從多個源topic中獲取數據。
做業務處理，寫到下游的多個目的topic。
更新多個源topic的offset。

其中第2、3點作為一個事務，要麼全成功，要麼全失敗。這裡得益與offset實際上是用特殊的topic去保存，這兩點都歸一為寫多個topic的事務性處理。

基本思路是這樣的：

引入tid（transaction id），和pid不同，這個id是應用程序提供的，用於標識事務，和producer是誰並沒關係。就是任何producer都可以使用這個tid去做事務，這樣進行到一半就死掉的事務，可以由另一個producer去恢復。

同時為了記錄事務的狀態，類似對offset的處理，引入transaction coordinator用於記錄transaction log。在集群中會有多個transaction coordinator，每個tid對應唯一一個transaction coordinator。

注：transaction log刪除策略是compact，已完成的事務會標記成null，compact後不保留。

做事務時，先標記開啟事務，寫入數據，全部成功就在transaction log中記錄為prepare commit狀態，否則寫入prepare abort的狀態。之後再去給每個相關的partition寫入一條marker（commit或者abort）消息，標記這個事務的message可以被讀取或已經廢棄。成功後在transaction log記錄下commit/abort狀態，至此事務結束。

數據流：

Kafka Transactions Data Flow.png

首先使用tid請求任意一個broker（代碼中寫的是負載最小的broker），找到對應的transaction coordinator。
請求transaction coordinator獲取到對應的pid，和pid對應的epoch，這個epoch用於防止僵死進程復活導致消息錯亂，當消息的epoch比當前維護的epoch小時，拒絕掉。tid和pid有一一對應的關係，這樣對於同一個tid會返回相同的pid。
client先請求transaction coordinator記錄的事務狀態，初始狀態是BEGIN，如果是該事務中第一個到達的，同時會對事務進行計時；client輸出數據到相關的partition中；client再請求transaction coordinator記錄offset的事務狀態；client發送offset commit到對應offset partition。
client發送commit請求，transaction coordinator記錄prepare commit/abort，然後發送marker給相關的partition。全部成功後，記錄commit/abort的狀態，最後這個記錄不需要等待其他replica的ack，因為prepare不丟就能保證最終的正確性了。

這裡prepare的狀態主要是用於事務恢復，例如給相關的partition發送控制消息，沒發完就宕機了，備機起來後，producer發送請求獲取pid時，會把未完成的事務接著完成。

當partition中寫入commit的marker後，相關的消息就可被讀取。所以kafka事務在prepare commit到commit這個時間段內，消息是逐漸可見的，而不是同一時刻可見。

詳細細節可看：https://cwiki.apache.org/confluence/display/KAFKA/KIP-98+-+Exactly+Once+Delivery+and+Transactional+Messaging#KIP-98-ExactlyOnceDeliveryandTransactionalMessaging-TransactionalGuarantees

消費事務

前面都是從生產的角度看待事務。還需要從消費的角度去考慮一些問題。

消費時，partition中會存在一些消息處於未commit狀態，即業務方應該看不到的消息，需要過濾這些消息不讓業務看到，kafka選擇在消費者進程中進行過來，而不是在broker中過濾，主要考慮的還是性能。kafka高性能的一個關鍵點是zero copy，如果需要在broker中過濾，那麼勢必需要讀取消息內容到內存，就會失去zero copy的特性。

文件組織

kafka的數據，實際上是以文件的形式存儲在文件系統的。topic下有partition，partition下有segment，segment是實際的一個個文件，topic和partition都是抽象概念。

在目錄/

不能識別此Latex公式:
{topicName}-{

partitionid}/下，存儲著實際的log文件（即segment），還有對應的索引文件。

每個segment文件大小相等，文件名以這個segment中最小的offset命名，文件擴展名是.log；segment對應的索引的文件名字一樣，擴展名是.index。有兩個index文件，一個是offset index用於按offset去查message，一個是time index用於按照時間去查，其實這裡可以優化合到一起，下面只說offset index。總體的組織是這樣的：

kafka 文件組織.png

為了減少索引文件的大小，降低空間使用，方便直接加載進內存中，這裡的索引使用稀疏矩陣，不會每一個message都記錄下具體位置，而是每隔一定的字節數，再建立一條索引。索引包含兩部分，分別是baseOffset，還有position。

baseOffset：意思是這條索引對應segment文件中的第幾條message。這樣做方便使用數值壓縮算法來節省空間。例如kafka使用的是varint。

position：在segment中的絕對位置。

查找offset對應的記錄時，會先用二分法，找出對應的offset在哪個segment中，然後使用索引，在定位出offset在segment中的大概位置，再遍歷查找message。

常用配置項

broker配置

配置項作用broker.idbroker的唯一標識auto.create.topics.auto設置成true，就是遇到沒有的topic自動創建topic。log.dirslog的目錄數，目錄裡面放partition，當生成新的partition時，會挑目錄裡partition數最少的目錄放。

topic配置

配置項作用num.partitions新建一個topic，會有幾個partition。log.retention.ms對應的還有minutes，hours的單位。日誌保留時間，因為刪除是文件維度而不是消息維度，看的是日誌文件的mtime。log.retention.bytespartion最大的容量，超過就清理老的。注意這個是partion維度，就是說如果你的topic有8個partition，配置1G，那麼平均分配下，topic理論最大值8G。log.segment.bytes一個segment的大小。超過了就滾動。log.segment.ms一個segment的打開時間，超過了就滾動。message.max.bytesmessage最大多大

關於日誌清理，默認當前正在寫的日誌，是怎麼也不會清理掉的。

還有0.10之前的版本，時間看的是日誌文件的mtime，但這個指是不準確的，有可能文件被touch一下，mtime就變了。因此在0.10版本開始，改為使用該文件最新一條消息的時間來判斷。

按大小清理這裡也要注意，Kafka在定時任務中嘗試比較當前日誌量總大小是否超過閾值至少一個日誌段的大小。如果超過但是沒超過一個日誌段，那麼就不會刪除。

來源：http://t.cn/EIjENrg

分享到:

閱讀更多 Java芋道源碼 的文章

關鍵字: 分佈式文件組織 FLOW

一文帶你深入理解Apache Kafka

Kafka(一)

kafka、zookeeper安裝部暑與使用

Kafka 架構原理解析

深入瞭解Apache Kafka

Flink的sink實戰之二：kafka

kafka leader選舉機制

從源碼和日誌文件結構中分析 Kafka 重啟失敗事件

RocketMQ & Kafka 消息消費與消息重試

Kafka 的生產者優秀架構設計

從源碼分析如何優雅的使用 Kafka 生產者

Kafka Connect和Debezium，解析binlog至Kafka

Kafka 的這些原理你懂嗎

Kafka 使用

你能說出 Kafka 這些原理嗎？

架構師技能樹之——kafka

Kafka Eagle安裝詳情及問題解答

12.23 Kafka 的這些原理你知道嗎

12.20 優雅地部署 Kafka 集群

為什麼每一個爬蟲工程師都應該學習 Kafka

12.13 為什麼使用Apache Pulsar而不是Apache Kafka？

Kafka 日誌存儲詳解

Kafka-消費者提交偏移量

Kafka-消費者訂閱主題

Kafka命令行工具-kafka-topics

Kafka 基本原理

Zookeeper 在 Kafka 中的作用

[Kafka ]全面介紹Apache Kafka™

Kafka-python問題解決

如何找到 Kafka 集群的吞吐量極限？

基於 Kafka 實現分佈式事件驅動

SpringBoot+kafka+ELK分佈式日誌收集

公共安全領域 Kafka 應用實踐

ELK+kafka 大數據收集與實時查詢日誌應用平臺要點

崛起的 Kafka

Kafka「第一篇」Kafka集群搭建（轉）

Kafka Lag計算誤區及正確實現

Kafka Data Replication（副本策略）

Kafka,Mq,Redis作為消息隊列時的差異

Apache kafka 工作原理介紹

Python: kafka-python版本差異導致的問題

淺談分布式消息技術 Kafka

09.16 淺談分佈式消息技術 Kafka

kafka server.properties配置文件中所有配置參數說明（解釋）

爲什麼我們從RabbitMQ切換到apache kafka？

java編程——Kafka，Mq和Redis作爲消息隊列使用時的差異有哪些

kafka-修改內存大小

03.21 ELK + kafka 日誌方案

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"