[How-To] Monitor Cronjobs with Aria Operations

Back to Blog

[How-To] Monitor Cronjobs with Aria Operations

Bei einem Professional Services Projekt stellte der Kunde eine Anforderung an die Einrichtung des Backups von VMware SRM. Diese müsse automatisiert überwacht werden und eine Warnung generieren falls der Backup-Job einmal fehlschlagen sollte. In diesem Blogpost zeige ich auf wie ich dies umgesetzt habe.

 

Ausgangslage

Im beschriebenen Projekt hatten wir eine bestimmte Ausgangslage.

  • Installierte VMware Site Recovery Manager Instanz
  • Installierte VMware Aria Operations Instanz
  • Installierte VMware Aria Operations for Logs Instanz
  • Die beiden Lösungen sind miteinander integriert

Die Anforderung war diesen Cronjob zu überwachen und automatisch eine Warnung auf dem richtigen Objekt zu erzeugen, falls der Job einmal fehlschlagen sollte.

Die Lösung

Die Lösung ist konzeptionell sehr einfach.

concept of cronjob monitoring with aria operations and aria operations for logs

 

Anpassung des cronjobs

Mit dem Befehl

 crontab -e 

(als root) kann der crontab vom Root User ausgeführt werden.

Darin muss dem bestehenden Eintrag aus der Backup Einrichtung vom SRM Export Job ein logger Befehl angehängt werden.

2>&1 | logger -t export_sh -n syslog.soultec.ch -P 514 -T

der vollständige Eintrag könnte dann so aussehen:

45 15 * * * /usr/bin/sudo /bin/bash /opt/vmware/impex/bin/export.sh 2>&1 | logger -t export_sh -n syslog.soultec.ch -P 514 -T

Damit stellen wir sicher, dass bei Fehler aus dem export.sh Script diese an den logger weitergereicht werden und dieser den Eintrag zum Syslog Server weiterleitet.

 

Alarm definieren in Aria Operations for Logs

Der zweite Schritt besteht darin einen Alarm zu definieren der auch gleich eine Warnung in Aria Operations erzeugt.

Aria Operations for Logs Alert definition 1 of 2

Im ersten Bereich setzen wir den Text Filter auf “Export failed.” und die source muss den FQDN unseres SRM Servers enthalten.

In einer Zeitspanne von 5 Minuten wird der Alarm getriggert sobald mehr als 0 (null) Vorkommen gezählt wurden, also beim ersten Vorkommen.

Aria Operations for Logs Alert definition 2 of 2

Wir setzen den Haken “Send to VMware Aria Operations” und konfigurieren das entsprechende Fallback-Objekt auf den SRM Server. In unserem Fall ist die Kritikalität nur eine “Warning” und wir haben einen Auto cancel nach 24h drin (1440 Minuten). Damit wird die Warnung verschwinden wenn die Meldung sich nicht nach 24h wiederholt.

Damit hätten wir erfolgreich einen cronjob mittels logger befehl, Aria Operations for Logs und Aria Operations überwacht.

Next Steps

Hast du noch mehr Herausforderungen die in diese Richtung gehen? Unser Team von Experten ist jederzeit bereit dich dabei zu unterstützen. Einfach unverbindlich Kontakt mit uns aufnehmen.

Share this post

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to Blog