Verbessertes SCHMIEDER Systemmonitoring steigert die Verfügbarkeit Ihrer IT

15. Juni 2016 von Holger Schmieder

Netzwerkkomponenten

Neben den Statusinformationen, wie die Auslastung und Fehlerraten verbunden mit Langzeitstatistiken, fragen wir nun auch weitere wichtige Informationen ab. Hierzu gehören der komplette Hardwarestatus und Seriennummern, sowie vChassis und Chassisinformationen. Auch erkennen wir, ob die Konfiguration richtig gespeichert wurde.

Windows-Systeme

Wir haben eine Gruppe mit Diensten erstellt, die auf jedem Windows-Server laufen müssen. Die Gruppe wird per Standard abgefragt. Zusätzlich sind bereits Gruppen vorhanden, welche den Status von anderen Services anzeigen z.B. Virenschutz, SQL-Server, MS-Dynamics, SAP u.v.m.

Als individuelle Abfrage ist die Protokollierung von Disk-IO's neu hinzugekommen.

Linux Systeme

Die Standardabfrage (CPU, RAM, DISK) wurde erweitert um Mounts, Systeminfo und Prozesse. Bei den Prozessen gilt wie für Windows-Systeme: Es lassen sich zusätzliche Gruppen mit Applikations-spezifischen Services erstellen. Für die CPU erfolgt jetzt eine Langzeitprotokollierung der Auslastung aller Kerne.

Bei den Mounts werden zusätzlich der Filesystem-Typ und die Belegung ausgegeben.

VMware vSphere

Die Erfahrung hat gezeigt, dass Snapshots, die zu lange stehen bleiben, kritisch bei der Auflösung sind. Aus diesem Grund wird ab sofort eine Warnung ausgegeben, sollten Snapshots älter als drei Tage sein. Außerdem wird die VMFS Belegung, die Last der ESX-Server etc. in Langzeitstatistiken protokolliert.

Storage Systeme

Derzeit sind Abfragen für EMC- und NetApp-Systeme vorhanden. Hierbei prüfen wir den Hardwarestatus von Netzteilen, Controllern etc. und erstellen Langzeitstatistiken für LUN's und Volumes.

Eine neue Abfrage erkennt, wenn eine LUN-Anbindung über den Tress-Pass des Storages erfolgt.

Standard- und individuelle Gruppen

Die Abfragen lassen sich bündeln. Ein SAP-Server kann beispielsweise eine Sammelgruppe enthalten, die folgendes abfragt:

  • Notwendige Dienste
  • Verfügbarkeit und Antwortzeiten der Konnektoren
  • Status der Datenbank etc.

Individuelle Ausschlüsse

Unsere Schwellwerte sind eingestellt nach dem Prinzip: "Was für den einen Kunden gut ist, kann für den anderen nicht schlecht sein!"

Dennoch gibt es teilweise Systeme, die vom Standard abweichen. Hierfür haben wir nun eine Overwrite-Möglichkeit geschaffen, die diesen speziellen Service, verbunden mit einem Vermerk, anpasst.

Change Management

Bei Firewalls und Netzwerkkomponenten werden Änderungen in der Konfiguration erkannt und als Warnung ausgegeben. Diese können im Serviceweb mit einem Vermerk versehen und bestätigt werden.

OPL-Liste

Manchmal kann es dazu kommen, dass Fehler oder Warnungen für einen längeren Zeitraum anstehen. Sie haben die Möglichkeit, diesen Fehler lokal an Ihrem System zu bestätigen. Über das Serviceweb haben Sie ebenfalls die Möglichkeit der Bestätigung und können das Problem gleichzeitig einer Person zuordnen, welche dann wöchentliche Erinnerungs-Mails mit der Bitte um Beseitigung erhält.

Management-Bericht (Optionales Zusatzmodul)

Wir erstellen Ihnen einen monatlichen Bericht Ihres Systems mit folgenden Kernaussagen:

  • Verfügbarkeit der Einzelsysteme und Systemgruppen
  • Top10 der Auslastung von Netzwerk-Anschlüssen
  • Infos über Sonderregelungen, OPL's und Ausschlüssen

Der Bericht lässt sich individuell für Ihr Unternehmen anpassen.

Raumüberwachung und Hardware

Neben Rittal-CMC, HP-Inside, APC-USC's etc. haben wir das Raummonitoring von Kentix neu eingebunden.

Alerting

Das Alerting lässt sich Gruppen- und Servicebezogen einstellen. Sie können die Meldungen sowohl nach intern als auch nach extern weiterleiten.

NEU: SCHMIEDER Alerting-Hub (Zusatzoption):

Dieses System ist in der Lage, Meldungen unseres Monitoring, aber auch beliebige andere Systemmeldungen zu konsolidieren und anhand eines Dienstplanes per Sprachnachricht, SMS oder Mail an die zum jeweiligen Zeitpunkt zuständigen Personen weiterzuleiten. Der Diensthabende muss bestätigen, dass er sich dem Problem annimmt.

Zukunft

Für die kommenden Monate haben wir folgende Erweiterungen geplant:

  • Pflege aller Daten im Serviceweb
  • Seriennummern direkt in der Datenbank
  • Weitere Standard-Abfragen
  • Change-Management für Windows- und Linux-Systeme

Eines ist aber geblieben:

Unser Systemmonitoring hat das Ziel, alle IT-Systeme in Ihrem Haus vollumfänglich zu überwachen. Ohne Ihnen zusätzliche Arbeit zu machen, profitieren unsere Kunden gegenseitig. Wenn wir für einen Kunden eine neue Abfrage generieren, steht diese auch allen anderen Kunden zur Verfügung – ohne jegliche Zusatzkosten!

Zurück zur Übersicht