ElasticSearch安裝詳解及採坑

2020-04-02 07:20:50 浩渺煙波

ElasticSearch是一個分佈式的，高性能，高可用的，可伸縮的搜索和分析系統

（1）可以作為大型分佈式集群（數百臺服務器）技術，處理PB級的數據，服務大公司；也可以運行在單機上服務於小公司

（2）Elasticsearch不是什麼新技術，主要是將全文檢索、數據分析以及分佈式技術，合併在了一起，才形成了獨一無二的ES：lucene(全文檢索)，商用的數據分析軟件，分佈式數據庫

（3）對用戶而言，是開箱即用的，非常簡單，作為中小型應用，直接3分鐘部署一下ES，就可以作為生產環境的系統來使用了，此時的場景是數據量不大，操作不是太複雜

（4）數據庫的功能面對很多領域是不夠用的（事務，還有各種聯機事務型的操作）；

特殊的功能，比如全文檢索，同義詞處理，相關度排名，複雜數據分析，海量數據的近實時處理，Elasticsearch作為傳統數據庫的一個補充，提供了數據庫所不能提供的很多功能

下載：

<code>wget  https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.1.0.tar.gz/<code>

解壓：

<code>tar -zxvf elasticsearch-6.1.0.tar.gz -C ~/training//<code>

修改配置文件：config/elasticsearch.yml，需要修改的沒有多少：

<code>cluster.name: william
node.name: node-1
node.attr.rack: r1
path.data: /trainging/elasticsearch-6.1.0/data
path.logs: /trainging/elasticsearch-6.1.0/logs
bootstrap.memory_lock: false
bootstrap.system_call_filter: false
network.host: xxxxx
http.port: 9200
discovery.zen.ping.unicast.hosts: ["127.0.0.1"]

http.cors.enabled: true
http.cors.allow-origin: "*"
node.master: true
node.data: true/<code>

每個參數的具體意思如下，轉自別人的博客

<code>elasticsearch的config文件夾裡面有兩個配置文 件：elasticsearch.yml和logging.yml，第一個是es的基本配置文件，第二個是日誌配置文件，es也是使用log4j來記錄日 志的，所以logging.yml裡的設置按普通log4j配置文件來設置就行了。下面主要講解下elasticsearch.yml這個文件中可配置的 東西。

cluster.name: elasticsearch
配置es的集群名稱，默認是elasticsearch，es會自動發現在同一網段下的es，如果在同一網段下有多個集群，就可以用這個屬性來區分不同的集群。

node.name: "Franz Kafka"
節點名，默認隨機指定一個name列表中名字，該列表在es的jar包中config文件夾裡name.txt文件中，其中有很多作者添加的有趣名字。

node.master: true
指定該節點是否有資格被選舉成為node，默認是true，es是默認集群中的第一臺機器為master，如果這臺機掛了就會重新選舉master。 


node.data: true
指定該節點是否存儲索引數據，默認為true。

index.number_of_shards: 5
設置默認索引分片個數，默認為5片。

index.number_of_replicas: 1
設置默認索引副本個數，默認為1個副本。

path.conf: /path/to/conf
設置配置文件的存儲路徑，默認是es根目錄下的config文件夾。

path.data: /path/to/data
設置索引數據的存儲路徑，默認是es根目錄下的data文件夾，可以設置多個存儲路徑，用逗號隔開，例：
path.data: /path/to/data1,/path/to/data2

path.work: /path/to/work
設置臨時文件的存儲路徑，默認是es根目錄下的work文件夾。

path.logs: /path/to/logs
設置日誌文件的存儲路徑，默認是es根目錄下的logs文件夾

path.plugins: /path/to/plugins
設置插件的存放路徑，默認是es根目錄下的plugins文件夾

bootstrap.mlockall: true
設置為true來鎖住內存。因為當jvm開始swapping時es的效率 會降低，所以要保證它不swap，可以把ES_MIN_MEM和ES_MAX_MEM兩個環境變量設置成同一個值，並且保證機器有足夠的內存分配給es。 同時也要允許elasticsearch的進程可以鎖住內存，linux下可以通過`ulimit -l unlimited`命令。 


network.bind_host: 192.168.0.1
設置綁定的ip地址，可以是ipv4或ipv6的，默認為0.0.0.0。


network.publish_host: 192.168.0.1
設置其它節點和該節點交互的ip地址，如果不設置它會自動判斷，值必須是個真實的ip地址。

network.host: 192.168.0.1
這個參數是用來同時設置bind_host和publish_host上面兩個參數。

transport.tcp.port: 9300
設置節點間交互的tcp端口，默認是9300。

transport.tcp.compress: true
設置是否壓縮tcp傳輸時的數據，默認為false，不壓縮。

http.port: 9200
設置對外服務的http端口，默認為9200。

http.max_content_length: 100mb
設置內容的最大容量，默認100mb

http.enabled: false
是否使用http協議對外提供服務，默認為true，開啟。

gateway.type: local
gateway的類型，默認為local即為本地文件系統，可以設置為本地文件系統，分佈式文件系統，hadoop的HDFS，和amazon的s3服務器，其它文件系統的設置方法下次再詳細說。 


gateway.recover_after_nodes: 1
設置集群中N個節點啟動時進行數據恢復，默認為1。

gateway.recover_after_time: 5m
設置初始化數據恢復進程的超時時間，默認是5分鐘。

gateway.expected_nodes: 2
設置這個集群中節點的數量，默認為2，一旦這N個節點啟動，就會立即進行數據恢復。

cluster.routing.allocation.node_initial_primaries_recoveries: 4
初始化數據恢復時，併發恢復線程的個數，默認為4。

cluster.routing.allocation.node_concurrent_recoveries: 2
添加刪除節點或負載均衡時併發恢復線程的個數，默認為4。

indices.recovery.max_size_per_sec: 0
設置數據恢復時限制的帶寬，如入100mb，默認為0，即無限制。

indices.recovery.concurrent_streams: 5
設置這個參數來限制從其它分片恢復數據時最大同時打開併發流的個數，默認為5。

discovery.zen.minimum_master_nodes: 1
設置這個參數來保證集群中的節點可以知道其它N個有master資格的節點。默認為1，對於大的集群來說，可以設置大一點的值（2-4）

discovery.zen.ping.timeout: 3s 

設置集群中自動發現其它節點時ping連接超時時間，默認為3秒，對於比較差的網絡環境可以高點的值來防止自動發現時出錯。

discovery.zen.ping.multicast.enabled: false
設置是否打開多播發現節點，默認是true。

discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]
設置集群中master節點的初始列表，可以通過這些節點來自動發現新加入集群的節點。

下面是一些查詢時的慢日誌參數設置
index.search.slowlog.level: TRACE
index.search.slowlog.threshold.query.warn: 10s
index.search.slowlog.threshold.query.info: 5s
index.search.slowlog.threshold.query.debug: 2s
index.search.slowlog.threshold.query.trace: 500ms

index.search.slowlog.threshold.fetch.warn: 1s
index.search.slowlog.threshold.fetch.info: 800ms
index.search.slowlog.threshold.fetch.debug:500ms
index.search.slowlog.threshold.fetch.trace: 200ms/<code>

啟動 bin/elasticsearch

錯誤：Error: Could not find or load main class org.elasticsearch.tools.JavaVersionChecker。不要放在root目錄下即可Caused by: java.lang.RuntimeException: can not run elasticsearch as root. 不能使用root用戶

所以創建一個用戶，並將elasticsearch copy到不是root的目錄下：

<code>[root@VM_0_11_centos training]# adduser william
[root@VM_0_11_centos training]# cp -a elasticsearch-6.1.0/ /trainging/
[root@VM_0_11_centos training]# cd /trainging/
[root@VM_0_11_centos trainging]# chown -R william:william elasticsearch-6.1.0//<code>

但是又出現了錯誤：

<code>[william@VM_0_11_centos elasticsearch-6.1.0]$ bin/elasticsearch
which: no java in (/root/training/jdk1.8.0_161/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin)
could not find java; set JAVA_HOME or ensure java is in PATH/<code>

因為新創建的這個用戶沒有權限訪問jdk中的命令，把安裝在root目錄下的jdk移出到根目錄下，並重新配置下環境變量即可

啟動又出錯：

<code> max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]/<code>

原因是用戶擁有的內存太小：切換到root用戶修改一下

<code>sysctl -w vm.max_map_count=262144/<code>

查看： sysctl -a|grep vm.max_map_count永久解決辦法：

<code>在   /etc/sysctl.conf文件最後添加一行
vm.max_map_count=262144/<code>

在另一臺機器上報了一個這麼的錯誤max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]解決方法：修改/etc/security/limits.conf文件，增加配置，用戶退出後重新登錄生效

<code>*               soft    nofile          65536
*               hard    nofile          65536/<code>

啟動起來就可以訪問了，在瀏覽器裡面輸入你的ip:9200如果訪問不了，看下你的防火牆關了麼：

<code>systemctl status firewalld查看當前防火牆狀態。
 systemctl stop firewalld關閉當前防火牆。
 systemctl disable firewalld開機防火牆不啟動。/<code>

終於可以訪問了：

為了看起來好看，我們安裝插件 ElasticSearch-header

首先需要安裝 npm

<code>yum install npm/<code>

將ElasticSearch-head 下載到本地，它是github的開源項目：

<code>git clone git://github.com/mobz/elasticsearch-head.git
cd elasticsearch-head
npm install/<code>

安裝的過程中又報錯：

<code> Failed at the [email protected] install script 'node install.js'.
npm ERR! Make sure you have the latest version of node.js and npm installed./<code>

看樣子是nodejs 沒安裝，得安裝nodejs

<code> wget https://nodejs.org/dist/v12.16.1/node-v12.16.1-linux-x64.tar.xz
  tar xf node-v12.16.1-linux-x64.tar.xz /<code>

然後添加環境變量，繼續安裝ElasticSearch-header: npm install

報錯：

<code>npm ERR! Failed at the [email protected] install script./<code>

解決方法是：

<code>npm install [email protected] --ignore-scripts/<code>

好了總算安裝成功了：

<code>+ [email protected]
added 75 packages from 69 contributors, removed 5 packages and audited 1751 packages in 21.413s
3 packages are looking for funding
  run `npm fund` for details
found 50 vulnerabilities (21 low, 8 moderate, 21 high) 

  run `npm audit fix` to fix them, or `npm audit` for details/<code>

啟動：

<code>npm run start/<code>

實際上完全沒有必要折騰這麼多，可以直接Chrome瀏覽器下載個擴展插件裝Chome瀏覽器裡就可以，效果是一樣的，還簡單：

在這裡插入圖片描述

下載地址：https://github.com/mobz/elasticsearch-head/blob/master/crx/es-head.crx下載之後改為rar為後綴的文件之後解壓，在Chrome瀏覽器裡添加已解壓的擴展程序就可以了

單節點的ElasticSearch就算搭建好了，該踩的坑一個沒拉下！

參考： https://segmentfault.com/a/1190000018876875 https://blog.csdn.net/paicmis/article/details/82535018 https://blog.csdn.net/zhangshenghang/article/details/100113290 https://blog.csdn.net/cnweike/article/details/33736429 https://www.cnblogs.com/shixiuxian/p/11196654.html

分享到:

閱讀更多 浩渺煙波 的文章

關鍵字: Lucene Wget Java虛擬機

ElasticSearch 基本概念與操作

Elasticsearch 清空index數據的方法

Elasticsearch

Elasticsearch 優化

Elasticsearch Nested類型深入詳解

Python Elasticsearch DSL 搜索

Python Elasticsearch DSL 的使用

Elasticsearch Dynamic Mapping動態映射策略-動態模板

SpringData Elasticsearch、Elasticsearch、Spring Boot兼容矩陣

ElasticSearch & Kibana版本選擇與安裝

Elasticsearch Dynamic Mapping動態映射策略-Part 2

Elasticsearch dynamic mapping動態映射策略

Elasticsearch：將mysql數據導入到Elasticsearch中

Elasticsearch(docker)環境搭建

ElasticSearch-hard插件及IK分詞器安裝

一篇就懂 Elasticsearch

03.04 一篇就懂 Elasticsearch

02.28 ElasticSearch 介紹及使用方法

02.26 elasticsearch 操作報錯只讀 read-only

Elasticsearch 中映射參數doc

Elasticsearch 與傳統數據庫到底有什麼不同

Elasticsearch：一個索引只能包含一個映射類型

ElasticSearch 倒排索引簡析

Elasticsearch 開箱指南

Elasticsearch JAVA API ---索引api（二）

Elasticsearch JAVA API ---Springboot2.x中配置使用（一）

Elasticsearch 索引分片與副本設置技巧

Spring Boot (4) 整合 Elasticsearch

12.22 Elasticsearch Java 客戶端

12.05 ElasticSearch 最全詳細使用教程

12.04 為什麼需要 Elasticsearch？

ElasticSearch QueryCache漫談

Elasticsearch 漫談

ElasticSearch Rest

Elasticsearch 億級數據檢索性能優化案例實戰

Flink 實時寫入數據到 ElasticSearch 性能調優

Elasticsearch 7.3.2 發佈，分佈式搜索和數

Elasticsearch 7.x Nested 嵌套類型查詢

Elasticsearch、MongoDB和Hadoop比較

Elasticsearch—基礎介紹及索引原理分析

ElasticSearch 集群搭建

SpringBoot+Elasticsearch

聽說你還沒掌握 ElasticSearch Normalizer 的使用方法？

elasticsearch-php安裝

elasticsearch-6.3.2 安裝（三）安裝ik中文分詞（ik+pinyin）

Elasticsearch SQL

elasticsearch 單機多節點配置

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"