比如,對于使用來prometheus的alertmanager來做node報警,rules配置可以參考如下點進行配置即可。
說明
不同的node-exporter版本,對應的metrics也不一樣,需要自己對照更改一下。
CPU監控
(1 – avg(irate(node_cpu{mode=\”idle\”}[10m])) by (instance)) * 100 < 90
內存監控
((node_memory_MemTotal – node_memory_MemFree) / node_memory_MemTotal) * 100 < 90
磁盤IO監控
(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10
文件系統可用空間監控
max(((node_filesystem_size{fstype=~\”ext4|vfat\”} – node_filesystem_free{fstype=~\”ext4|vfat\”}) / node_filesystem_size{fstype=~\”ext4|vfat\”}) * 100) by (instance) > 90
關于k8s node alertmanager監控報警配置方法是什么就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
更多關于云服務器,域名注冊,虛擬主機的問題,請訪問三五互聯官網:m.shinetop.cn