Nagios Fragen
Neo-=IuE=- 26.11.2008 - 13:01 978 9
Neo-=IuE=-
Here to stay
|
Hi,
ich bin in der Arbeit dabei unsere Nagios-Checks zu überarbeiten und würde gerne bei manchen Sachen nur SMS aussenden wenn mehrere Events eintreten.
Lässt sich das realisieren, wenn ja über welchen Weg?
Das Topic lass ich gezielt ungenau, weil es kommen sicher nocht Fragen dazu, wobei ich den größten Teil eh durch die Nagios-Anleitung gelöst habe.
Aja Nagios Version 3.0rc2
tia Neo
PS: wenn der thread eher in ein netzwerk oder software forum gehört, bitte moven
EDIT:
aja gleich noch was, wenn ich zb eine gruppe mit 20 hosts hab und ich möchten einen check drauf anwenden, nur ich weiß, dass es auf 1em sicher net geht, kann ich dann den check trotzdem auf die gruppe anwenden und nur den 1en ausschließen?
Bearbeitet von Neo-=IuE=- am 26.11.2008, 13:05
|
noledge
CWNE #540
|
gehts bei frage 1 darum, wenn mehrere services eines hosts nicht gehn? oder services verschiedener hosts? wenn ersteres, is das eher eine einfache abbildung (wenn 2 von n services nicht gehn, wenn 50% von n services nicht gehen, wenn m von n services nicht gehen) oder gehts um spezifische services?
zu frage 2: meines wissens nicht. ich löse das immer mit 2 gruppen, und der eine host ist halt in einer der beiden gruppen nicht drinnen. eine andere (aber nicht so schöne) lösung wär alles gleichzulassen und den service auf dem host händisch zu deaktivieren und ein passives "OK" zu submitten. dann macht er nie ärger, hat aber theoretisch natürlich ein service eingeblendet, das er garnicht hat.
|
BuSHidO
ist süß
|
1) wahrscheinlich ist "check_multi" dass was du suchst.
damit kannst du mehrere Checks korrelieren und eine logik angeben. (Also wenn service 1&2 critical ist dann warning uvm.)
2) Ja geht, beim service musst du den einen host exkludieren. hostgroup_name hostgruppe host_name !host1
|
Neo-=IuE=-
Here to stay
|
zu 1 geht darum, dass wenn beim loadbalancer mehrere farmen nicht erreichbar wären, dann wirds am loadbalancer liegen (also unsere verantwortung), wenn nur eine farm nicht geht, können auch nur die server der farm down sein und das wäre nicht unsere aufgabe das nur eine farm nicht geht wegen dem LB ist sehr unwahrscheinlich, deshalb wäre da keine notification nötig
das plugin hört sich nach dem an was ich suche, lieber wäre mir aber es mit nagios-bordmitteln zu lösen, wenn das geht
zu 2 wenn das mim ausschließen geht, wäre das super, gleich mal probieren edit: das geht schonmal DANKE!
Bearbeitet von Neo-=IuE=- am 27.11.2008, 09:22
|
BuSHidO
ist süß
|
1) das geht nicht mit nagios bordmitteln. ausser evtl mit einer service dependency welche überprüft ob der lb funktioniert. die würde dann bei den eizelnen farmen eingetragen werden. du hast dann natürlich dass problem mit zuvielen notifikationen (wenn der lb ausfällt bekommst von jeder farm eine)
2) du kannst übrigens auch in den hostgruppen "verneinen".
hostgroup_name all-win,!all-win-clients
ist eins der nagios 3x features
|
Neo-=IuE=-
Here to stay
|
zu 1 -> das problem ist, der lb hat ein mgmt interface, wenn das down is gehn alle services noch, aber der lb is einfach nicht mehr erreichbar für den nagios deshalb hab ich jede farm als eigenen host eingetragen, derzeit nur mit mail-notification, aber bei mehreren ausfällen hätte ich doch gerne ne sms zu 2, dass hab ich angenommen und auch gleich gemacht
|
BuSHidO
ist süß
|
nicht realisierbar mit nagios bordmitteln
wiegesagt am saubersten wäre es die lb funktionalität zu checken und mit der service dependency zu arbeiten
alternativ: check_multi oder du musst was eigenes coden (zb. alle farmen unter einem host gruppieren und dann mit $TOTALHOSTSERVICESCRITICAL$ im notification command arbeiten)
|
Neo-=IuE=-
Here to stay
|
hm das hört sich eh nicht schlecht an, dass würd mir schon reichen, dass wenn alle critical sind eine notification kommt  mal anschaun wenn ich zeit hab
|
noledge
CWNE #540
|
2) Ja geht, beim service musst du den einen host exkludieren. hostgroup_name hostgruppe host_name !host1 oha. geil, ich sollt mir die dokus genauer durchlesen, was an neuen features hinzugekommen ist. thx!
|
Neo-=IuE=-
Here to stay
|
das problem is, dass zb die sachen an ca. 3-4 stellen dokumentiert sind und das steht halt an einer andren als ich gsucht hab
|