快!5分鐘快速完成監控系統搭建

實踐課堂 | 快!5分鐘快速完成監控系統搭建

實踐課堂 | 快!5分鐘快速完成監控系統搭建

簡介: 監控告警系統是每一家企業都需要的系統。系統的監控運維告警可以幫助企業快速發現系統故障,定位故障和處理故障,對企業業務穩定性起到至關重要的作用。業務監控系統可以實時進行業務告警,進行業務趨勢的分析和判斷,對於數據化運營起到重要的幫助。

阿里雲InfluxDB 提供了一整套快速搭建監控系統的組件和功能,可以幫助企業快速搭建監控系統。2019年8月商業化以來,依靠穩定可靠的服務能力和免運維等特性,在監控領域受到很多用戶關注,近期更是進行了重磅升級,集成了Grafana可視化服務。

本文將以Linux系統指標監控為例,展示如何基於阿里雲InfluxDB®服務快速搭建一個監控系統。這裡假設用戶已經購買了阿里雲InfluxDB®實例,並且創建了名為telegraf的數據庫以及管理員賬號admin(也可以使用對該庫有讀寫權限的非管理員賬號)。如果您還沒有開啟阿里雲InfluxDB®服務,可以戳這裡 購買,數據庫和賬號如何創建請參考阿里雲文檔。(

基於阿里雲InfluxDB搭建監控系統可以分為二個簡單的步驟即可完成。
1 配置數據源
2 配置Grafana 儀表盤

接下來,我們就開始基於這兩個步驟快速實踐一下。 出於展示目的,本文使用的操作系統為CentOS 7,yum作為包管理工具,Ubuntu/Debian用戶可以用dpkg等工具完成類似操作。接下來我們實際操作一下。

配置數據採集

主機的系統監控需要安裝telegraf作為agent進行指標採集。telegraf是開源的指標採集工具,內用佔用小,安裝部署簡便,下面幾部就可以完成。如果有多臺主機需要監控,在每臺主機上執行下面的步驟即可,在最後的監控儀表盤總可以使用下來列表來選擇主機信息。

Step 1: 安裝telegraf

這裡使用的是當前的最新穩定版本telegraf 1.12.4:

yum install -y https://dl.influxdata.com/telegraf/releases/telegraf-1.12.4-1.x86_64.rpm

Step 2: 配置telegraf

Telegraf配置文件的路徑為/etc/telegraf/telegraf.conf,使用文本編輯器(比如vim)對這個文件進行編輯,配置內容如下:

# 採集插件 

[[inputs.cpu]]
percpu = true
totalcpu = true
collect_cpu_time = false

[[inputs.disk]]
mount_points = ["/"]
ignore_fs = ["tmpfs", "devtmpfs"]

[[inputs.diskio]]
devices = ["vda"] # 這裡配置需要採集的磁盤設備

[[inputs.kernel]]

[[inputs.mem]]

[[inputs.processes]]

[[inputs.swap]]

[[inputs.system]]

[[inputs.net]]
interfaces = ["eth0"]

[[inputs.netstat]]

# influxdb 配置
[[outputs.influxdb]]
urls = ["https://ts-xxxxxxxxxx.influxdata.rds.aliyuncs.com:3242"] # influxdb實例的公網訪問地址
database = "telegraf"
username = "admin"
password = "yourpassword"

注意在[[outputs.influxdb]]部分設置阿里雲InfluxDB®實例的訪問地址,數據寫入的數據庫名,以及訪問數據庫的賬號信息。

Step 3: 啟動telegraf

配置文件編輯保存好,使用下面的命令啟動telegraf服務,主機指標數據就可以寫入到InfluxDB®中了

systemctl start telegraf.service

配置Grafana

Grafana是流行的開源時序分析平臺,採用go語言編寫,當前活躍安裝數高達40萬,可以說是監控場景的標配組件了。Grafana支持多種流行的數據源,比如InfluxDB、Prometheus、OpentTSDB、Graphite等;可視化方面Grafana提供了酷炫的圖表,用戶可以動態創建儀表盤(dashboard),支持模板變量作為下拉列表;數據探索(Explore)頁面允許用戶使用ad-hoc查詢在數據源上進行數據分析,並且提供了語句自動補全等貼心功能;支持郵件、webhook等多種報警通道,用戶可以自定義報警規則。

阿里雲將Grafana監控可視化與InfluxDB®的存儲分析能力無縫對接,讓用戶無需部署和運維就可以在快速搭建一個監控系統,並且不需要支付額外費用。

Step 4: 配置Grafana數據源源

要使用Grafana,需要配置與InfluxDB®數據庫相關聯的數據源,我們在telegraf庫上創建一個名為my-datasource的數據源,具體步驟參考文檔,這裡不重複了。

Step 5: 創建儀表盤

用戶可以使用查詢語句創建儀表盤,為每個panel定義查詢語句和展示方式;實際上多數場景下不需要這麼麻煩,因為官方社區中有很多優秀的儀表盤模板(https://grafana.com/grafana/dashboards),可以很好的滿足需求。

比如我們要配置的Linux主機監控,可以直接使用Linux System Overview 這個儀表盤:

實踐課堂 | 快!5分鐘快速完成監控系統搭建

而我們要做的只是記住2381這個dashboard ID。

從阿里雲InfluxDB®控制檯打開Grafana訪問地址,登錄之後即可進入儀表盤管理界面:

實踐課堂 | 快!5分鐘快速完成監控系統搭建

在儀表盤管理界面,點擊Import按鈕進入Import頁面,輸入這個ID即可:

實踐課堂 | 快!5分鐘快速完成監控系統搭建

輸入ID後,Grafana會自動識別,進入選項頁面,進行數據源的配置,這裡我們選擇之前創建好的數據源 my-datasource

實踐課堂 | 快!5分鐘快速完成監控系統搭建

然後點擊Import,儀表盤就創建好了!

實踐課堂 | 快!5分鐘快速完成監控系統搭建

總結

本文展示瞭如何基於阿里雲InfluxDB®服務快速搭建一個主機監控系統,指標數據通過telegraf進行採集,數據寫入到InfluxDB®進行存儲,Grafana作為前端進行可視化展示,用戶也可以根據自己的需求在Grafana配置報警。阿里雲InfluxDB®提供的Grafana服務為用戶降低了運維和硬件成本,與InfluxDB的存儲分析能力相得益彰,為監控領域的用戶提供了一個絕佳的選擇。

更新: 近期阿里雲InfluxDB®推出了一元購優惠活動,新用戶可以首月一元體驗,規格選擇4c16g即可:

實踐課堂 | 快!5分鐘快速完成監控系統搭建

實踐課堂 | 快!5分鐘快速完成監控系統搭建


分享到:


相關文章: