想做服務監控自動重啟 - Linux

Table of Contents

板上的大大們好

小弟我最近要做系統服務的死活監控
監控的項目包含
httpd snmp named nginx redis-server node mysqld mongod PM2 memcached

服務都有加上enable自動啟動

為了保險
寫了一隻script 確認運作期間的狀態
systemctl status $line | grep running && echo "$line OK" || echo "$line error
!"

但是考慮到服務hang住
或是重啟一直失敗之類的狀況

想請教除了我這種使用systemctl及service status的方式
或是telnet確認port狀態 , wget針對網頁服務測試
還有沒有別的方式呢?

--

All Comments

Harry avatarHarry2017-11-18
nagios ? 你大概需要這種監視服務
George avatarGeorge2017-11-22
只是老實說稍微複雜,不是非常易用的軟體
Olga avatarOlga2017-11-23
systemd service 檔案有個 Restart= 選項可以自動服務
Mia avatarMia2017-11-24
可以先用 man systemd.service 看看這功能是否適合使用
再用 systemctl edit 把 Restart= 參數加上去
Odelette avatarOdelette2017-11-26
是正常的,因為 systemctl edit 的作法是在
Linda avatarLinda2017-11-26
/etc/systemd/system 底下建一個資料夾在裡面寫 .conf 檔
Kristin avatarKristin2017-11-26
這樣就不會直接動到 service 檔,更新時才不會被覆寫掉
Joseph avatarJoseph2017-11-28
改完可以用 systemctl cat 看到一個服務有多少這種檔案
Aaliyah avatarAaliyah2017-12-02
Ubuntu 有一個monit 的套件,預設就可以監控httpd等常用服務
Aaliyah avatarAaliyah2017-12-03
範例說明 goo.gl/WEkmyM
Robert avatarRobert2017-12-04
centos 也有這套件 goo.gl/qd8js8
Olivia avatarOlivia2017-12-07
svscan
Suhail Hany avatarSuhail Hany2017-12-09
nagios 裝起來一堆寫好的 plugin 隨插即用 哪裡困難阿
Jacky avatarJacky2017-12-13
munin + monit
Susan avatarSusan2017-12-14
supervisord...怎麼沒人提呢?
Gary avatarGary2017-12-17
跟systems 是同類的東西,如果只是要重啟夠用了,
有web gui跟導log的功能,不過你這麼多服務,學個
經典的nagios啊,介面是有點陽春,但是你提到的那
些全部都有現成的plugin,上手後隨插即用
Charlotte avatarCharlotte2017-12-18
mongod異常退出的話,是無法直接重啟的,因為會被lock f
ile卡住,要先下完 --repair 才有辦法重新打開
Bennie avatarBennie2017-12-21
keepalived 運用在NGINX httpd應該是沒問題,其他服務沒試過
,給您參考