乾貨 | Elasticsearch 索引設計實戰指南

2021-04-06 00:05:33 佚名

題記

隨著 Elastic 的上市，ELK Stack 不僅在 BAT 的大公司得到長足的發展，而且在各個中小公司都得到非常廣泛的應用，甚至連“婚慶網站”都開始使用 Elasticsearch 了。隨之而來的是 Elasticsearch 相關部署、框架、性能優化的文章早已鋪天蓋地。

初學者甚至會進入幻覺——“一鍵部署、導入數據、檢索&聚合、動態擴展， So Easy，媽媽再也不用擔心我的 Elastic 學習”！

但，實際上呢？僅就 Elasticsearch 索引設計，請回答如下幾個問題：

每天幾百 GB 增量實時數據的TB級甚至PB級別的大索引如何設計？
分片數和副本數大小如何設計，才能提升 ES 集群的性能？
ES 的 Mapping 該如何設計，才能保證檢索的高效？
檢索類型 term/match/matchphrase/querystring /match_phrase _prefix /fuzzy 那麼多，設計階段如何選型呢？
分詞該如何設計，才能滿足複雜業務場景需求？
傳統數據庫中的多表關聯在 ES 中如何設計？......

這麼看來，沒有那麼 Easy，坑還是得一步步的踩出來的。

正如攜程架構師 WOOD 大叔所說“做搜索容易，做好搜索相當難！”，

VIVO 搜索引擎架構師所說“ 熟練使用 ES 離做好搜索還差很遠！”。

本文主結合作者近千萬級開發實戰經驗，和大家一起深入探討一下Elasticsearch 索引設計......

索引設計的重要性

在美團寫給工程師的十條精進原則中強調了“設計優先”。無數事實證明，忽略了前期設計，往往會帶來很大的延期風險。並且未經評估的不當的設計會帶來巨大的維護成本，後期不得不騰出時間，專門進行優化和重構。

而 Elasticsearch 日漸成為大家非結構數據庫的首選方案，項目前期良好的設計和評審是必須的，能給整個項目帶來收益。

索引層面的設計在 Elasticsearch 相關產品、項目的設計階段的作用舉重若輕。

好的索引設計在整個集群規劃中佔據舉足輕重的作用，索引的設計直接影響集群設計的好壞和複雜度。
好的索引設計應該是充分結合業務場景的時間維度和空間維度，結合業務場景充分考量增、刪、改、查等全維度設計的。
好的索引設計是完全基於“設計先行，編碼在後”的原則，前期會花很長時間，為的是後期工作更加順暢，避免不必要的返工。

1、PB 級別的大索引如何設計？

單純的普通數據索引，如果不考慮增量數據，基本上普通索引就能夠滿足性能要求。

我們通常的操作就是：

步驟 1：創建索引；
步驟 2：導入或者寫入數據；
步驟 3：提供查詢請求訪問或者查詢服務。

1.1 大索引的缺陷

如果每天億萬+的實時增量數據呢，基於以下幾點原因，單個索引是無法滿足要求的。在 360 技術訪談中也提到了大索引的設計的困惑。

1.1.1 存儲大小限制維度

單個分片（Shard）實際是 Lucene 的索引，單分片能存儲的最大文檔數是：2,147,483,519 (= Integer.MAX_VALUE - 128)。如下命令能查看全部索引的分隔分片的文檔大小：

<code>

GET

_cat/shardsapp_index

STARTED

9443

8mb

127.0

Hk9wFwUapp_index

UNASSIGNED

app_index

STARTED

9462

7mb

127.0

Hk9wFwUapp_index

UNASSIGNED

app_index

STARTED

9520

5mb

127.0

Hk9wFwUapp_index

UNASSIGNED

app_index

STARTED

9453

4mb

127.0

Hk9wFwUapp_index

UNASSIGNED

app_index

STARTED

9365

3mb

127.0

Hk9wFwUapp_index

UNASSIGNED

/<code>

1.1.2 性能維度

當然一個索引很大的話，數據寫入和查詢性能都會變差。

而高效檢索體現在：基於日期的檢索可以直接檢索對應日期的索引，無形中縮減了很大的數據規模。

比如檢索：“2019-02-01”號的數據，之前的檢索會是在一個月甚至更大體量的索引中進行。

現在直接檢索"index_2019-02-01"的索引,效率提升好幾倍。

1.1.3 風險維度

一旦一個大索引出現故障，相關的數據都會受到影響。而分成滾動索引的話，相當於做了物理隔離。

1.2 PB 級索引設計實現

綜上，結合實踐經驗，大索引設計建議：使用模板+Rollover+Curator動態創建索引。動態索引使用效果如下：

<code>index_2019-01
-01
-000001i
ndex_2019-01
-02
-000002i 
ndex_2019-01
-03
-000003i
ndex_2019-01
-04
-000004i
ndex_2019-01
-05
-000005
/<code>

1.2.1 使用模板統一配置索引

目的：統一管理索引，相關索引字段完全一致。

1.2.2 使用 Rollver 增量管理索引

目的：按照日期、文檔數、文檔存儲大小三個維度進行更新索引。使用舉例：

<code>POST
 /logs_write/_rollover {  "conditions"
: {    "max_age"
:   "7d"
,    "max_docs" 
:  1000,    "max_size"
:  "5gb"
  }}/<code>

1.2.3 索引增量更新原理

一圖勝千言。

索引更新的時機是：當原始索引滿足設置條件的三個中的一個的時候，就會更新為新的索引。為保證業務的全索引檢索，一般採用別名機制。

在索引模板設計階段，模板定義一個全局別名：用途是全局檢索，如圖所示的別名：indexall。每次更新到新的索引後，新索引指向一個用於實時新數據寫入的別名，如圖所示的別名：indexlatest。同時將舊索引的別名 index_latest 移除。

別名刪除和新增操作舉例：

<code>POST /_aliases{  "actions"
 : [      { "remove"
 : { "index"
 : "index_2019-01-01-000001"
, "alias"
 : "index_latest"
 } },      { "add"
 : { "index"
 : "index_2019-01-02-000002" 
, "alias"
 : "index_latest"
 } }  ]}/<code>

經過如上步驟，即可完成索引的更新操作。

1.2.4 使用 curator 高效清理歷史數據

目的：按照日期定期刪除、歸檔歷史數據。

一個大索引的數據刪除方式只能使用 delete_by_query，由於 ES 中使用更新版本機制。刪除索引後，由於沒有物理刪除，磁盤存儲信息會不減反增。有同學就反饋 500GB+ 的索引 delete_by_query 導致負載增高的情況。

而按照日期劃分索引後，不需要的歷史數據可以做如下的處理。

刪除——對應 delete 索引操作。
壓縮——對應 shrink 操作。
段合併——對應 force_merge 操作。

而這一切，可以藉助：curator 工具通過簡單的配置文件結合定義任務 crontab 一鍵實現。

注意：7.X高版本藉助iLM實現更為簡單。

舉例，一鍵刪除 30 天前的歷史數據：

<code>  [root@localhost .curator]/<code>

2、分片數和副本數如何設計？

2.1 分片/副本認知

1、分片：分片本身都是一個功能齊全且獨立的“索引”，可以託管在集群中的任何節點上。

數據切分分片的主要目的：

（1）水平分割/縮放內容量。

（2）跨分片（可能在多個節點上）分佈和並行化操作，提高性能/吞吐量。

注意：分片一旦創建，不可以修改大小。

2、副本：它在分片/節點出現故障時提供高可用性。

副本的好處：因為可以在所有副本上並行執行搜索——因此擴展了搜索量/吞吐量。

注意：副本分片與主分片存儲在集群中不同的節點。副本的大小可以通過：number_of_replicas動態修改。

2.2 分片和副本實戰中設計

最常見問題答疑

2.2.1 問題 1：索引設置多少分片？

Shard 大小官方推薦值為 20-40GB, 具體原理呢？Elasticsearch 員工 Medcl 曾經討論如下：

Lucene 底層沒有這個大小的限制，20-40GB 的這個區間範圍本身就比較大，經驗值有時候就是拍腦袋，不一定都好使。

Elasticsearch 對數據的隔離和遷移是以分片為單位進行的，分片太大，會加大遷移成本。

一個分片就是一個 Lucene 的庫，一個 Lucene 目錄裡面包含很多 Segment，每個 Segment 有文檔數的上限，Segment 內部的文檔 ID 目前使用的是 Java 的整型，也就是 2 的 31 次方，所以能夠表示的總的文檔數為Integer.MAXVALUE - 128 = 2^31 - 128 = 2147483647 - 1 = 2,147,483,519，也就是21.4億條。

同樣，如果你不 forcemerge 成一個 Segment，單個 shard 的文檔數能超過這個數。

單個 Lucene 越大，索引會越大，查詢的操作成本自然要越高，IO 壓力越大，自然會影響查詢體驗。

具體一個分片多少數據合適，還是需要結合實際的業務數據和實際的查詢來進行測試以進行評估。

綜合實戰+網上各種經驗分享，梳理如下：

第一步：預估一下數據量的規模。一共要存儲多久的數據，每天新增多少數據？兩者的乘積就是總數據量。
第二步：預估分多少個索引存儲。索引的劃分可以根據業務需要。
第三步：考慮和衡量可擴展性，預估需要搭建幾臺機器的集群。存儲主要看磁盤空間，假設每臺機器2TB，可用：2TB0.85(磁盤實際利用率）0.85(ES 警戒水位線）。
第四步：單分片的大小建議最大設置為 30GB。此處如果是增量索引，可以結合大索引的設計部分的實現一起規劃。

前三步能得出一個索引的大小。分片數考慮維度：

1）分片數 = 索引大小/分片大小經驗值 30GB 。
2）分片數建議和節點數一致。設計的時候1）、2）兩者權衡考慮+rollover 動態更新索引結合。

每個 shard 大小是按照經驗值 30G 到 50G，因為在這個範圍內查詢和寫入性能較好。

經驗值的探推薦閱讀：

Elasticsearch究竟要設置多少分片數？

探究 | Elasticsearch集群規模和容量規劃的底層邏輯

2.2.2 問題 2：索引設置多少副本？

結合集群的規模，對於集群數據節點 >=2 的場景：建議副本至少設置為 1。

之前有同學出現過：副本設置為 0，長久以後會出現——數據寫入向指定機器傾斜的情況。

注意：

單節點的機器設置了副本也不會生效的。副本數的設計結合數據的安全需要。對於數據安全性要求非常高的業務場景，建議做好：增強備份（結合 ES 官方備份方案）。

3、Mapping 如何設計？

3.1 Mapping 認知

Mapping 是定義文檔及其包含的字段的存儲和索引方式的過程。例如，使用映射來定義：

應將哪些字符串字段定義為全文檢索字段；
哪些字段包含數字，日期或地理位置；
定義日期值的格式（時間戳還是日期類型等）；
用於控制動態添加字段的映射的自定義規則。

3.2 設計 Mapping 的注意事項

ES 支持增加字段 //新增字段

<code>PUT
 new_index  {    "mappings"
: {      "_doc"
: {        "properties"
: {          "status_code"
: {            "type"
:       "keyword"
          }        }      }    }  }/<code>

ES 不支持直接刪除字段
ES 不支持直接修改字段
ES 不支持直接修改字段類型如果非要做靈活設計，ES 有其他方案可以替換，藉助reindex。但是數據量大會有性能問題，建議設計階段綜合權衡考慮。

3.3 Mapping 字段的設置流程

索引分為靜態 Mapping（自定義字段）+動態 Mapping（ES 自動根據導入數據適配）。

實戰業務場景建議：選用靜態 Mapping，根據業務類型自己定義字段類型。

好處：

可控；
節省存儲空間（默認 string 是 text+keyword，實際業務不一定需要）。

設置字段的時候，務必過一下如下圖示的流程。根據實際業務需要，主要關注點：

數據類型選型；
是否需要檢索；
是否需要排序+聚合分析；
是否需要另行存儲。

核心參數的含義，梳理如下：

3.4 Mapping 建議結合模板定義

索引 Templates——索引模板允許您定義在創建新索引時自動應用的模板。模板包括settings和Mappings以及控制是否應將模板應用於新索引。

注意：模板僅在索引創建時應用。更改模板不會對現有索引產生影響。

第1部分也有說明，針對大索引，使用模板是必須的。核心需要設置的setting（僅列舉了實戰中最常用、可以動態修改的）如下：

index.numberofreplicas 每個主分片具有的副本數。默認為 1（7.X 版本，低於 7.X 為 5）。
index.maxresultwindow 深度分頁 rom + size 的最大值—— 默認為 10000。
index.refresh_interval 默認 1s：代表最快 1s 搜索可見；

寫入時候建議設置為 -1，提高寫入性能；

實戰業務如果對實時性要求不高，建議設置為 30s 或者更高。

3.5 包含 Mapping 的 template 設計萬能模板

以下模板已經在 7.2 驗證 ok，可以直接拷貝修改後實戰項目中使用。

<code>PUT _template/test_template{  "index_patterns"
: [    "test_index_*"
,    "test_*"
  ],  "settings"
: {    "number_of_shards"
: 1,    "number_of_replicas"
: 1,    "max_result_window"
: 100000,    "refresh_interval" 
: "30s"
  },  "mappings"
: {    "properties"
: {      "id"
: {        "type"
: "long"
      },      "title"
: {        "type"
: "keyword"
      },      "content"
: {        "analyzer"
: "ik_max_word"
,        "type"
: "text"
,        "fields"
: {          "keyword"
: {            "ignore_above"
: 256,            "type"
: "keyword"
          }        }      },      "available"
: {        "type"
: "boolean"
      },      "review"
: {        "type"
: "nested" 
,        "properties"
: {          "nickname"
: {            "type"
: "text"
          },          "text"
: {            "type"
: "text"
          },          "stars"
: {            "type"
: "integer"
          }        }      },      "publish_time"
: {        "type"
: "date"
,        "format"
: "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
      },      "expected_attendees"
: {        "type"
: "integer_range"
      },      "ip_addr"
: {        "type"
: "ip"
      },      "suggest"
: {        "type"
: "completion"
      }    }  }}/<code>

4、分詞的選型

主要以 ik 來說明，最新版本的ik支持兩種類型。ik_maxword 細粒度匹配，適用切分非常細的場景。ik_smart 粗粒度匹配，適用切分粗的場景。

4.1 坑 1：分詞選型

實際業務中：建議適用ik_max_word分詞 + match_phrase短語檢索。

原因：ik_smart有覆蓋不全的情況，數據量大了以後，即便 reindex 能滿足要求，但面對極大的索引的情況，reindex 的耗時我們承擔不起。建議ik_max_word一步到位。

4.2 坑 2：ik 要裝集群的所有機器嗎？

建議：安裝在集群的所有節點上。

4.3 坑 3：ik 匹配不到怎麼辦？

方案1：擴充 ik 開源自帶的詞庫+動態更新詞庫；原生的詞庫分詞數量級很小，基礎詞庫儘量更大更全，網上搜索一下“搜狗詞庫“。

動態更新詞庫：可以結合 mysql+ik 自帶的更新詞庫的方式動態更新詞庫。

更新詞庫僅對新創建的索引生效，部分老數據索引建議使用 reindex 升級處理。

方案2：採用字詞混合索引的方式，避免“明明存在，但是檢索不到的”場景。探究 | 明明存在，怎麼搜索不出來呢？

5、檢索類型如何選型呢？

前提：5.X 版本之後，string 類型不再存在，取代的是text和keyword類型。

text 類型作用：分詞，將大段的文字根據分詞器切分成獨立的詞或者詞組，以便全文檢索。

適用於：email 內容、某產品的描述等需要分詞全文檢索的字段；

不適用：排序或聚合（Significant Terms 聚合例外）

keyword 類型：無需分詞、整段完整精確匹配。

適用於：email 地址、住址、狀態碼、分類 tags。

以一個實戰例子說明：

<code>    PUT
 zz_test    {      "mappings"
: {              "doc"
: {        "properties"
: {            "title"
: {              "type"
: "text"
,              "analyzer"
:"ik_max_word"
,              "fields"
: {                "keyword"
: {                  "type"
: "keyword"
,                  "ignore_above"
: 256                }              }            }          }        }      }    }GET zz_test/_mappingPUT zz_test/doc/1{  "title"
:"錘子加溼器官方致歉,難產後臨時推遲一個月發貨遭diss耍流氓"
}POST zz_test/_analyze{  "text"
: "錘子加溼器官方致歉,難產後臨時推遲一個月發貨遭diss耍流氓"
,  "analyzer"
: "ik_max_word"
}/<code>

ik_max_word的分詞結果如下：

錘子、錘、子、加溼器、溼、器官、官方、方、致歉、致、歉、難產、產後、後、臨時、臨、時、推遲、遲、一個、一個、一、個月、個、月、發貨、發、貨、遭、diss、耍流氓、耍、流氓、氓。

5.1 term 精確匹配

核心功能：不受到分詞器的影響，屬於完整的精確匹配。
應用場景：精確、精準匹配。
適用類型：keyword。
舉例：term 最適合匹配的類型是 keyword，如下所示的精確完整匹配：

<code>    POST
 zz_test/_search    {      "query"
: {        "term"
: {          "title.keyword"
: "錘子加溼器官方致歉,難產後臨時推遲一個月發貨遭diss耍流氓"
        }      }    }/<code>

注意：如下是匹配不到結果的。

<code>POST
 zz_test/_search{  "query"
: {    "term"
: {      "title"
: "錘子加溼器"
    }  }}/<code>

原因：對於 title 中的錘子加溼器，term 不會做分詞拆分匹配的。且 ik_max_word 分詞也是沒有“錘子加溼器”這組關鍵詞的。

5.2 prefix 前綴匹配

核心功能：前綴匹配。
應用場景：前綴自動補全的業務場景。
適用類型：keyword。

如下能匹配到文檔 id 為 1 的文章。

<code>POST
 zz_test/_search{  "query"
: {    "prefix"
: {       
"title.keyword"
: "錘子加溼器"
    }  }}/<code>

5.3 wildcard 模糊匹配

核心功能：匹配具有匹配通配符表達式 keyword 類型的文檔。支持的通配符：*，它匹配任何字符序列（包括空字符序列）；？，它匹配任何單個字符。
應用場景：請注意，選型務必要慎重！此查詢可能很慢多組關鍵次的情況下可能會導致宕機，因為它需要遍歷多個術語。為了防止非常慢的通配符查詢，通配符不能以任何一個通配符*或？開頭。
適用類型：keyword。

如下匹配，類似 MySQL 中的通配符匹配，能匹配所有包含加溼器的文章。

<code>POST
 zz_test/_search{  "query"
: {    "wildcard"
: {      "title.keyword"
:  
"*加溼器*"
    }  }}/<code>

5.4 match 分詞匹配

核心功能：全文檢索，分詞詞項匹配。
應用場景：實際業務中較少使用，原因：匹配範圍太寬泛，不夠準確。
適用類型：text。
如下示例，title 包含"錘子"和“加溼器”的都會被檢索到。

<code>POST zz_test/_search{  "profile"
: true
,   "query"
: {    "match"
: {      "title"
: "錘子加溼器"
    }  }}/<code>

5.5 match_phrase 短語匹配

核心功能：match_phrase 查詢首先將查詢字符串解析成一個詞項列表，然後對這些詞項進行搜索; 只保留那些包含全部搜索詞項，且位置"position" 與搜索詞項相同的文檔。
應用場景：業務開發中 90%+ 的全文檢索都會使用 match_phrase 或者 query_string 類型，而不是 match。
適用類型：text。
注意：

<code>POST
 zz_test/_analyze{  "text"
: "錘子加溼器"
,  "analyzer"
: "ik_max_word"
}/<code>

分詞結果：

錘子，錘，子，加溼器，溼，器。而：id為1的文檔的分詞結果：錘子, 錘, 子, 加溼器, 溼, 器官。所以，如下的檢索是匹配不到結果的。

<code>POST
 zz_test/_search{"query" 
: {  "match_phrase"
: {    "title"
: "錘子加溼器"
  }}}/<code>

如果想匹配到，怎麼辦呢？這裡可以字詞組合索引的形式。

來自：大數據技術架構

分享到:

關鍵字: type 分詞加溼器

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

記者從河北省公安廳獲悉，日前公安部通緝的13名A級通緝犯中的2號通緝犯魯某某近日向河北邯鄲警方投案自首，這是公安部A級通緝令後又一通緝犯主動投案。

當我們在談 SaaS 的時候，在談什麼？

當我們在談SaaS 的時候，在談什麼？什麼是 SaaSSaaS 優缺點SaaS 銷售模式SaaS 產品指標SaaS 業務指標SaaS 收入計算一、什麼是 SaaS這個模式讓軟件變得和水電氣很相似，只需要每月繳納固定的費用即可享受服務。

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

現階段，隨著國家供給側結構性改革的不斷深入，人們在市場中的互易行為日益頻繁，合同在經濟活動發揮的作用也日漸凸顯。

5月西安招聘會時間安排來了！找工作的別錯過

乘車路線:西安市內乘坐12路、14路、14路區間、26路、215路、215路區間、216路、224路、229路、239路、31路、36路、321路、323路、521路、600路、603路、616路、701路、704路、709路、教育專線、K605路、K616路、遊6路、遊8路61

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

基於以太坊區塊鏈的主要穩定幣包括：Tether、TrueUSD、GeminiDollar、Paxos Standard、Binance USD、USD Coin、Huobi USD和MakerDAO等。

“幫助當地居民解決用水難題”-今日頭條-手機光明網

晨曦初露，9歲的米格爾和弟弟妹妹們抱著水罐，穿過一片田野，到達安哥拉首都羅安達郊區的指定取水點。葛洲壩安哥拉有限公司市場部負責人劉世軒介紹說，公司每天派出送水車兩次，一次3車，將潔淨水從羅安達水廠直接運往指定取水點。

灌籃高手無水印壁紙，每一張都是回憶

那些年，我們追過的灌籃高手，你更喜歡誰呢？流川楓櫻木花道赤木剛憲宮城良田三井壽你喜歡哪個球員呢？歡迎評論區留言。

通遼藍天救援隊成功解救遼河公園水上被困群眾

2020年5月1日，通遼藍天救援隊假期例行在遼河公園水域進行安全巡邏任務，下午15時10分，巡邏隊員發現遼河水面有被困群眾向巡邏船隻求救，接到求救信號後，巡邏隊員緊急前往事故現場展開研判、救援準備工作。

5月6日·武漢要聞及抗擊肺炎快報

今天零時起高速公路恢復收費了，這些車輛還能免費5月6日零時起全國高速公路恢復收費在武漢北收費站ETC和人工車道全部可通行零時左右通過收費站的車輛並不多以大貨車為主有工作人員在一旁引導貨車進入高速收費站前要通過入口稱重檢測車道進入沒有超重超限便可順利通過現場沒有出現排隊的現象全省聯

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

2020年4月29日下午，肖副省長等省市領導來到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作，肖副省長等省市領導在學校領導陪同下，重點對校門口出入、保健室、教室、學生心理輔導室、洗手池等進行了非常細緻的檢查，對孝感市楚澴中學的復學和疫情防控工作給予充分的肯定。

相聲界的顏值擔當張雲雷稱號大揭祕

這個播放量就連師傅身為相聲演員的張雲雷卻有著堪比娛樂圈小鮮肉的顏值，一個相聲演員長成這樣，張雲雷不火誰能火。

美國百年薅羊毛攻略

當德國向法軍陣地傾洩400多萬發炮彈，揚言要讓凡爾登成為「碾碎法軍的絞肉機」時，遠在大西洋的美國人。

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

近日，由楊洋、江疏影主演的劇版《全職高手》在騰訊視頻正式開播了，該劇改編自蝴蝶藍同名小說，先前還被改編成動畫版。

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

前言：IG這隻老牌戰隊在我們LPL賽區以來都擁有著非常高的人氣，特別是在2018年之後，他們幫助我們LPL賽區奪得了第一個寶貴的S賽世界冠軍，而IG戰隊的打法一直以來也是非常有觀賞性的。

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

Doinb表示："可以的話我不想參加，首先這場比賽沒有任何意義，獲得勝利既不會有獎金也不會有榮譽，但萬一輸掉比賽FPX就會成為大家吐槽的焦點"。

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

大家都知道天后王菲和前夫李亞鵬他們育有一個女兒，名叫李嫣。於是李嫣因為偷偷的開了直播從而也導致了她被大家所發現，但李嫣的樂觀和開朗卻也讓李亞鵬放下心來，決定放飛女兒，讓她自由的去探索她想要的世界。

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

天王郭富城近日參加活動，首度承認妻子方媛懷有二胎的消息。從去年2017年兩人結婚，低調的愛情讓媒體都捕捉不到邊際，天王嫂31歲兩人相差了20歲的愛戀，始終不少人不看好啊。

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

演員在我們眼中一直都是光鮮亮麗、收入頗高的職業，並且現在有很多靠流量躋身一線，卻毫無演技以及實力的演員。

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

曾經賈乃亮是“陽光”的代名詞，大家看到他都覺得很暖，只不過後來就不是了。今天早上，他發了一條微博“人生的美好就是每天醒來都能看到上帝賜予我的那一米陽光”，這句話當中，賈乃亮用到了“一米陽光”這個詞。

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

當一名理髮師也不容易這是一隻有航天夢想的老鼠寶寶！什麼？這麼貴！把我賣了得了。小朋友，你贏了，我甘拜下風！

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

程瀟可謂是才女，她是中韓宇宙少女的成員之一，今年她只有20歲。不要看程瀟年紀比較小，但是她身材還是挺好的，身材也是典型S型曲線，魅力不小。

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

張柏芝是許多80後90後心目中的女神，除了顏值高有演技外，她和謝霆鋒的婚姻和戀情也曾是吃瓜群眾津津樂道的事。

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

前言：目前各大賽區的春季賽都已經結束了，T1戰隊在重組之後再度拿下了lck賽區的冠軍，這讓很多的玩家非常意外，這也從側面反映出來了，核心選手和主教練的個人能力，同時faker的實力再度被玩家們認可，最近一段時間他也是一直在直播，很多的人都在詢問，今年李哥的目標是什麼？

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

上線之後迅速引發了大量玩家的好評，就在最近，官方也是迎來了10.9版本，可是在目前的版本中再度出現了太多的畸形玩法了，應該是有史以來最不平衡的版本，因為一費卡的爆率大大提升，導致遊戲成為了三星的天下，全員搶一費卡，運氣成為吃雞的關鍵。

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

在本期節目中會評選出一位最美麗LPL女解說，其中瞳夕、Rita、餘霜等都在名單之中，最有趣的是管澤元居然也出現在了“女解說”名單中，全因餘霜一張P過的照片，論梗的話，管澤元第一，若是輪顏值，估計這也排不上名次。

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

不過要是像唐嫣和羅晉那樣用公費談戀愛的故事不多，大多數還是和不是心愛的人拍得多，但要是遇上岳雲鵬和佟麗婭拍親熱戲的話，那個畫面或許大家想象不出來吧。

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

LPL賽區的春季賽結束也有一段時間了，作為冠軍戰隊JDG，並沒有因為拿到冠軍而出現“人氣”的高漲，依舊平平淡淡，熟悉LPL賽區的玩家都知道，在LPL賽區中，一直以來都是由RNG、IG、EDG三家從“遠古”時期就開始統治LPL賽區，期間也有OMG和LGD、WE幾個戰隊打破了這個規律

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

學習結束，回到家後，在武大短暫學習的那段時光時常讓我懷念，並曾立下誓言，抽個暑假一定要帶著老婆孩子一起去“逛”武大。機會就這麼悄然而至！2019年第28屆世界腦力錦標賽全球總決賽的舉辦地就是武漢，比賽的日期是12月6日到8日，三天的時間。其實，我也沒有想到第一次參加這樣比賽的女兒

T1提議中韓友誼賽，但LPL隊伍都不想參加？理由其實很簡單

這不今天就有網友在論壇中聊起了這個話題，有網友表示“LPL隊伍其實都不想參加中韓友誼賽，LPL隊伍才剛結束春季賽，18天之後就要打夏季賽了，像IG可能會有人員變動FPX TES 應該也會利用這段時間來檢討分析，也許只有JDG 比較願意參加，doinb只是第一表態的選手，可能還有很

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽，於2020年04月28日上線，由信陽本地聯盟上傳。西瓜視頻為您提供高清視頻，畫面清晰、播放流暢，看豐富、高質量視頻就上西瓜視頻。

2020最佳韓劇追起來~《愛的迫降》僅排名第二，TOP 1絕對實至名歸

TOP20 - 「優雅的家」這部由林秀香、李章宇、裴宗玉等人所主演的《優雅的家》，當時一播出就引起不少話題，雖然劇情有點浮誇，但卻莫名好看，而當時該劇還刷新了MBN電視臺的記錄呢~《優雅的家》主要講述一位擁有完美外貌和身材的MC集團獨生女毛碩熙，為了查明15年母親去世的真相，因此

搞笑GIF開心一刻：我正在睡覺，誰敢打擾我

我這暴脾氣，等你剝完我能吃五個你帶著你家貓去做演員吧！這貓太有前途了！這是我見過最牛的啦啦隊！自從有了弟弟，老大就和家務結緣了狼狗：要不是主人在，我非吃了你兩個小子！

備考消防的幾大錯覺，你有這個情況嗎？

講真，很多時候我們會把事情想當然，並因為這些錯覺而採取錯誤的舉動，一消備考是一場毅力和心智的戰鬥，大家難免會產生一些錯覺，從而影響自己的備考效率，甚至導致備考失敗。

“頂流”李敏鎬啞火，渣男出軌劇出圈，韓劇觀眾也長大了？

豆瓣開分8.3，漸漸跌到7.7分，熱門短評寫道：“同樣是金編，差距怎麼這麼大”、“看了四集節奏真的是一團糟，比起隔壁《夫妻的世界》真的差一大截”。

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患

隨著“五一”期間氣溫大幅回升全國大部分地區已經進入初夏在享受小長假春日美景的同時森林火險等級也隨之明顯提升新疆森林消防提示您春季氣溫回升快野外草木乾燥你的一個失當用火行為就有可能引發森林大火勿念蔥林繁似海一星燃盡只塵埃

搞笑GIF開心一刻：拍照啦，趕緊看鏡頭

弟弟：姐姐你能利索點嗎家裡有個熊孩子，說實話心很累同學感覺你好可伶，一個人跳舞多尷尬啊！看我病好了怎麼收拾你們！真的是以迅雷不及掩耳之勢啊。姑涼，你……掉毛啊！小姐姐你是想找男朋友嗎用這樣的方式，結局很意外此處注意安全！

工程發承包、工程造價條款，或迎來大調整

第二章建設規劃與設計第一節建設規劃第八條建設規劃的體系第九條建設規劃的編制與審批第十條建設規劃的內容第十一條建設規劃的實施與評估第二節城市設計第十二條城市設計的基本要求第十三條城市設計的編制和審批第十四條城市設計的實施和管理第三節建築設計第十五條建築設計的基

新增四省！關於2019年一級建造師考試證書、複核發佈公告

快來看看吧~青海關於恢復專業技術人員職業資格證書的發放、補辦工作的通知各位考生：隨著疫情防控進入常態化，青海省新冠疫情得到有效控制，專業技術人員職業資格證書的印製、發放工作正在逐步恢復，為方便廣大考生辦理證書業務，4月28日起青海省人力資源和社會保障服務中心一樓大廳65、66號辦

學霸也會復讀？朱廣權這個圈粉無數的國民段子手是如何煉成的！

“煙籠寒水月籠沙，不止東湖與櫻花，門前風景雨來佳，蓮藕魚糕玉露茶，鳳爪藕帶熱乾麵，米酒香菇小龍蝦，守住金蓮不自誇，趕緊下單買回家，買它買它就買它，熱乾麵和小龍蝦。”

幸福的人，總會忘記舊愛

幸福從來不可能是有個人幫你搞定所有的一切，而你只需要坐享其成。她喜歡喝銀耳蓮子羹而且必須是上好的銀耳，用小火慢慢燉到砧稠那一日，他去看她，她冷冷地從屋裡走出來，丟給他一本書.對他說:"廚房裡小鍋燉著東西，你幫我去看看。”他真真地守了一個多小時，端到她面前。

真人芭比：一直說自己“沒整容”最後晒出舊照，打臉的卻是自己

俗話說的好“愛美之心人人都有”而讓自己快速變美的方法無疑就是“整容”如今的社會整容看起來似乎很平常。

驚了！這件事沒有做，一消證書等於白考！

不要慌，同學們，遇到問題不要怕，拿到證書不去註冊，相當於證書無效，今天就為大家一一解答註冊證書的相關問題。

8年後，有哪些人會留在農村生活？以下4類人群或將留下，有你嗎

從九十年代末開始，在我國農村地區就興起了一股“進城潮”，記得那個時候，農村的經濟發展相對滯後，村民生活條件艱苦，鄉親們為了擺脫貧困，只能告別親人，遠離家鄉去外面打拼賺錢。

唯一回絕張藝謀力捧的女生，被報送上清華，25歲有上百億身家

25歲有上百億身家文/娛樂深扒爆姐圖/網絡張藝謀是一位非常有實力的導演，同時非常出名，而且他拍攝的作品中有不少獲獎無數的經典影片，同時也捧紅過不少藝人。

疫情下的悲劇：買不起手機上網課，那個女孩決定吞藥自殺

有人為了生計不顧自身安危，有人躲在家中安然度日，還有人僅僅因為一個手機，就要放棄自己的生命...這個女孩，今年上初三，因為疫情的原因，全國各地都展開了網課線上教育，女孩的學校也不例外。

李棟旭劉仁娜新劇開拍，互對臺詞歡樂多，終於要開始撒狗糧了嗎？

這部劇是2016年年底播出的，熱度一直持續到了2017年，相關的周邊和景點都相當熱門，像是池恩卓跟鬼怪大叔相遇的海邊、劇中出現的鬼怪玩偶、還有鬼怪大叔的拔劍特效等等。

高考延期：七月的高考，最熱的天，做最難的題！

後來，由於7月份氣候較差，極端天氣頻發，尤其是南方地區，要麼極端高溫，要麼就是颱風，對於高考來說非常不友好，不僅考生的考試質量會下降，而且閱卷老師、高考工作者也不方便，因此，從2003年開始，高考日期都固定在了每年的6月7日、8日。

乾貨 | Elasticsearch 索引設計實戰指南

題記

索引設計的重要性

1、PB 級別的大索引如何設計？

1.1 大索引的缺陷

1.1.1 存儲大小限制維度

1.1.2 性能維度

1.1.3 風險維度

1.2 PB 級索引設計實現

1.2.1 使用模板統一配置索引

1.2.2 使用 Rollver 增量管理索引

1.2.3 索引增量更新原理

1.2.4 使用 curator 高效清理歷史數據

2、分片數和副本數如何設計？

2.1 分片/副本認知

2.2 分片和副本實戰中設計

2.2.1 問題 1：索引設置多少分片？

2.2.2 問題 2：索引設置多少副本？

3、Mapping 如何設計？

3.1 Mapping 認知

3.2 設計 Mapping 的注意事項

3.3 Mapping 字段的設置流程

3.4 Mapping 建議結合模板定義

3.5 包含 Mapping 的 template 設計萬能模板

4、分詞的選型

4.1 坑 1：分詞選型

4.2 坑 2：ik 要裝集群的所有機器嗎？

4.3 坑 3：ik 匹配不到怎麼辦？

5、檢索類型如何選型呢？

5.1 term 精確匹配

5.2 prefix 前綴匹配

5.4 match 分詞匹配

相關文章:

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

T1提議中韓友誼賽，但LPL隊伍都不想參加？理由其實很簡單

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽

2020最佳韓劇追起來~《愛的迫降》僅排名第二，TOP 1絕對實至名歸

搞笑GIF開心一刻：我正在睡覺，誰敢打擾我

備考消防的幾大錯覺，你有這個情況嗎？

“頂流”李敏鎬啞火，渣男出軌劇出圈，韓劇觀眾也長大了？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

應急科普丨“五一” 期間氣溫回升 謹防森林火災隱患

搞笑GIF開心一刻：拍照啦，趕緊看鏡頭

工程發承包、工程造價條款，或迎來大調整

新增四省！關於2019年一級建造師考試證書、複核發佈公告

學霸也會復讀？朱廣權這個圈粉無數的國民段子手是如何煉成的！

幸福的人，總會忘記舊愛

真人芭比：一直說自己“沒整容”最後晒出舊照，打臉的卻是自己

驚了！這件事沒有做，一消證書等於白考！

8年後，有哪些人會留在農村生活？以下4類人群或將留下，有你嗎

唯一回絕張藝謀力捧的女生，被報送上清華，25歲有上百億身家

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患