{"id":237,"date":"2012-12-11T18:12:33","date_gmt":"2012-12-11T17:12:33","guid":{"rendered":"http:\/\/www.symablog.de\/blog\/?p=237"},"modified":"2013-01-29T08:33:20","modified_gmt":"2013-01-29T07:33:20","slug":"monitoring-eskalation-von-storungen-problemen-situationen","status":"publish","type":"post","link":"https:\/\/www.symablog.de\/blog\/monitoring-eskalation-von-storungen-problemen-situationen\/","title":{"rendered":"Monitoring &#038; Eskalation von St\u00f6rungen, Problemen, Situationen"},"content":{"rendered":"<p><strong>IT-Komponenten, die produktiv Gesch\u00e4ftsprozesse unterst\u00fctzen oder vollst\u00e4ndig abbilden, m\u00fcssen \u00fcberwacht werden. St\u00f6rungen, Probleme und Situationen werden erfasst, auf Konsolen dargestellt, via SMS und Telefon eskaliert und notwendige T\u00e4tigkeiten zur L\u00f6sung in Ticketsystemen angewiesen und dokumentiert.<\/strong><\/p>\n<p>Die vielf\u00e4ltigen technischen Systeme, die uns t\u00e4glich an jeder Ecke unterst\u00fctzen, neigen zu Fehlern und Ausf\u00e4llen. Zus\u00e4tzlich machen Menschen Fehler und l\u00f6sen auch dadurch St\u00f6rungen aus, verursachen Probleme im Betrieb.<\/p>\n<p>Die IT als Dienstleister und grunds\u00e4tzlicher Tr\u00e4ger von Gesch\u00e4ftsabl\u00e4ufen ist ebenso anf\u00e4llig f\u00fcr technische Fehler und menschliches Fehlverhalten. Technische Komponenten m\u00fcssen deshalb \u00fcberwacht und m\u00f6gliches menschliches Fehlverhalten durch unterst\u00fctzende Prozesse, z.B. Plausibilit\u00e4tspr\u00fcfungen, reduziert und in seiner Auswirkung minimiert werden.<\/p>\n<p><strong>Welche Komponenten sollten \u00fcberwacht werden?<\/strong><\/p>\n<p>Die IT als Dienstleister unterst\u00fctzt Gesch\u00e4ftsprozesse. Somit m\u00fcssen nach M\u00f6glichkeit alle beteiligten Komponenten \u00fcberwacht und im Fehlerfall eskaliert werden.<br \/>\nDas k\u00f6nnen z.B. sein:<\/p>\n<ul>\n<li>Server ( Hardware, Betriebssystem )<\/li>\n<li>Datenbanken<\/li>\n<li>Netzwerkkomponenten ( Router, Switche )<\/li>\n<li>Applikationssoftware \/ notwendige Dienste<\/li>\n<li>Verbindungen zu angeschlossenen Systemen, Internet, MQSeries, &#8230;<\/li>\n<li>Storagesysteme &#8211; verf\u00fcgbare Kapazit\u00e4ten, SAN-Verbindungen<\/li>\n<\/ul>\n<p>Dabei kann die \u00dcberwachung aktiv von den Komponenten durchgef\u00fchrt werden, oder passiv von einer zentralen Stelle z.B. durch &#8222;anpingen&#8220; erfolgen.<\/p>\n<p><strong>Typisierung von Situationen<\/strong><\/p>\n<p>Je nach Auswirkung einer Situation auf den Betrieb der Komponente, den Einflu\u00df auf den Service \/ Proze\u00df, werden Schweregrade (Severities) definiert. Nach festgestelltem Schweregrad mu\u00df eine Eskalation in der jeweiligen Stufe erfolgen.<\/p>\n<ul>\n<li><strong><span style=\"color: #ff0000;\">St\u00f6rung<\/span><\/strong> &#8211; Komponente funktioniert nicht mehr. Der Ablauf ist so gest\u00f6rt, dass der Proze\u00df zum Halten kommt. Kunden k\u00f6nnen das System nicht mehr nutzen. Dringender Handlungsbedarf durch den Support erforderlich.<\/li>\n<li><strong><span style=\"color: #ff0000;\">Problem<\/span><\/strong> &#8211; Komponente funktioniert eingeschr\u00e4nkt, der Proze\u00df l\u00e4uft noch, aber es sind weitergehende Einschr\u00e4nkungen, bis hin zu einem Ausfall zu erwarten. T\u00e4tigkeiten durch den Support sind notwendig, aber Kunden k\u00f6nnen noch arbeiten, ggf. eingeschr\u00e4nkt durch z.B. Performanceverringerung.<\/li>\n<li><strong><span style=\"color: #ff0000;\">Warnung<\/span><\/strong> &#8211; Es ist keine Einschr\u00e4nkung der erforderlichen Funktionalit\u00e4t vorhanden und kein aktives Eingreifen des Supports notwendig. Die gemeldete Situation sollte aber beachtet und f\u00fcr m\u00f6gliches Eingreifen vorgemerkt werden.<\/li>\n<li><strong><span style=\"color: #ff0000;\">Information<\/span><\/strong> &#8211; Eine Situation wird angezeigt und dient nur zur Visualisierung oder Information, z.B. f\u00fcr eine erfolgreiche Datei\u00fcbertragung oder Proze\u00dfschnitte.<\/li>\n<li><strong><span style=\"color: #ff0000;\">OK<\/span><\/strong>&#8211; oder Wiedergut-Meldungen dienen dazu eine vorhergehende Situtation zu beheben und weitergehende Eskalation in Alarme zu unterbinden.<\/li>\n<\/ul>\n<p><strong>Eskalation von Situationen<\/strong><\/p>\n<ul>\n<li>St\u00f6rung -&gt; Ticket\/Mail -&gt; AlarmSMS\/Voicecall<\/li>\n<li>Problem -&gt; Ticket\/Mail<\/li>\n<li>Warnung, Information -&gt; keine Eskalation, nur ggf. Darstellung auf technischer und\/oder proze\u00dforientierter Konsole<\/li>\n<\/ul>\n<p>Situationen werden durch die verschiedensten Quellen an ein zentrales System gemeldet. Dort findet nach einer Verarbeitung in einem Regelwerk die Speicherung in einer Datenbank statt. Diese zentrale Datenbasis dient dezentralen Konsolen zur Darstellung der Situationen, angepasst an die jeweilige Aufgabenstellung und Verantwortung des Betrachters.<br \/>\nAn der zentralen Stelle des Regelwerks und der Datenbasis wird abh\u00e4ngig von definierten Parametern eine Eskalation initiiert. Die erste Stufe der Eskalation kann ein Ticket \u00fcber ein HelpDesk- oder Ticketsystem sein, begleitet durch eine Mail. Oder es gibt in der einfachen L\u00f6sung nur eine Mail an die jeweilige Supportergruppe ( niemals an eine einzelne Person! ).<br \/>\nDie zweite Stufe ist die Eskalation via SMS und\/oder Anruf (VoiceCall) an ein Mobiltelefon einer Bereitschafts- oder Einsatzgruppe. Grundlage f\u00fcr die Eskalation in der zweiten Stufe ist aber immer eine Eskalation der ersten Stufe! Gr\u00fcnde sind ist detaillierte Information und die Verfolgung der Aktivit\u00e4ten durch die Systeme in der ersten Stufe.<br \/>\nKlar ist auch, das die unterschiedlichen Situationen in ihrem Schweregrad (Severity) eine jeweilige Eskalationsstufe nach sich ziehen. \u00dcber das Regelwerk kann ein Finetunig des Eskalationsweges, z.B. \u00fcber Alarmverz\u00f6gerung in der zweiten Stufe erfolgen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>IT-Komponenten, die produktiv Gesch\u00e4ftsprozesse unterst\u00fctzen oder vollst\u00e4ndig abbilden, m\u00fcssen \u00fcberwacht werden. St\u00f6rungen, Probleme und Situationen werden erfasst, auf Konsolen dargestellt, via SMS und Telefon eskaliert und notwendige T\u00e4tigkeiten zur L\u00f6sung in Ticketsystemen angewiesen und dokumentiert.\ufeff<\/p>\n <a class=\"more-link\" href=\"https:\/\/www.symablog.de\/blog\/monitoring-eskalation-von-storungen-problemen-situationen\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a>","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":false,"jetpack_social_options":{"image_generator_settings":{"template":"highway","enabled":false}}},"categories":[3,77],"tags":[50,29,54,25,53,192,55],"class_list":["post-237","post","type-post","status-publish","format-standard","hentry","category-systems-management","category-theorie","tag-eskalation","tag-monitoring","tag-problem","tag-situation","tag-storung","tag-systems-management","tag-warnung"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/p37Rzq-3P","_links":{"self":[{"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/posts\/237"}],"collection":[{"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/comments?post=237"}],"version-history":[{"count":26,"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/posts\/237\/revisions"}],"predecessor-version":[{"id":419,"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/posts\/237\/revisions\/419"}],"wp:attachment":[{"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/media?parent=237"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/categories?post=237"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.symablog.de\/blog\/wp-json\/wp\/v2\/tags?post=237"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}