Observability und Monitoring sind eng miteinander verwandt.
- Monitoring konzentriert sich in erster Linie auf vordefinierte Metriken und Schwellenwerte, um Health und Performance eines Systems zu verfolgen. Es ist reaktiv – Probleme werden also erst nach ihrem Auftreten identifiziert.
- Observability wiederum geht über das Monitoring hinaus und gibt Ihnen die Möglichkeit, den internen Zustand eines Systems anhand seiner Outputs wie Logs, Metriken und Traces abzuleiten. Observability ist proaktiv und präventiv, sodass Sie Problemen zuvorkommen können – lang bevor sie das Nutzungserlebnis beeinträchtigen.
Aus DevOps- und SRE-Sicht ist Monitoring also reaktiv und Observability proaktiv.
Warum ist es wichtig, den Unterschied zu kennen? Für einfache Stand-alone-Systeme ist Monitoring mit automatisiertem Alerting und Auswertung durch erfahrene IT-Fachleute eventuell die bessere Lösung. In Unternehmen mit komplexen Infrastrukturen, zahlreichen Microservices und rasanter Software-Entwicklung sowie häufigen Releases reicht Monitoring allein allerdings nicht unbedingt aus.
Observability-Tools können schnell Daten analysieren, die über die weltweit verteilten Hard- und Softwaresysteme eines Unternehmens gesammelt wurden. Sie erleichtern die Ermittlung von Fehlerursachen und die Automatisierung von Behebungsmaßnahmen. Und nicht zuletzt können Observability-Plattformen mithilfe von maschinellem Lernen und AIOps-Algorithmen die „unbekannten Unbekannten“ ermitteln, also Dinge aufzeigen, von denen Sie noch gar nicht wissen, dass sie zum Problem werden können.
In diesem Artikel befassen wir uns eingehender mit den Unterschieden und Gemeinsamkeiten zwischen Observability und Monitoring.
Was ist Monitoring?
Monitoring zeigt auf, dass etwas nicht stimmt. Beim Monitoring werden Systemdaten beobachtet und bei Hinweisen auf Probleme entsprechende Maßnahmen eingeleitet. Monitoring-Tools überwachen die Telemetrie Ihrer Systeme und können verwendet werden, um Informationen zu visualisieren und Alerts zu verschiedenen Metriken einzurichten (z. B. Netzwerk-Throughput, Ressourcennutzung, verfügbarer Speicher, Fehlerquoten). Logs können IT-Fachleuten weiteren Kontext zu den von Monitoring-Tools gemeldeten Problemen liefern. Ohne zusätzliche Analysen kann es jedoch schwierig sein, zukünftige Probleme ausschließlich auf der Grundlage überwachter Daten vorherzusagen.
Digital Experience Monitoring (DEM) und Real-User Monitoring (RUM) sammeln Daten aus der Benutzerperspektive, um sich ein Bild über die Interaktionen Ihrer Kundschaft mit Ihren digitalen Diensten zu machen.
Die so erfassten Daten geben DevOps, IT und Kundendienst Live-Einblicke in System-Performance und eventuelle Probleme. Allerdings informieren sie Ihre Teams nicht unbedingt darüber, warum und wie Probleme auftreten oder welche Auswirkungen diese haben könnten. Dazu braucht man Observability.
Was ist Observability?
Observability bringt eine neue Dimension ins Spiel und zeigt beim Auftreten von Problemen im gesamten Tech-Stack das „Was, Warum und wie“ zu diesen Problemen. Observability analysiert überwachte Metriken und Events sowie Logs, Traces und andere Inputs mithilfe von Methoden der künstlichen Intelligenz (KI) wie dem maschinellen Lernen. Zusammen liefern diese Observability-Prozesse letztendlich umsetzbare Einblicke in Systemprobleme. Manche Observability-Services prognostizieren Probleme sogar und empfehlen oder erstellen Automatisierungstools, um sie sofort zu eliminieren, bevor sie sich auf Kundenseite bemerkbar machen.
Observability und Monitoring: die wichtigsten Unterschiede
Observability ist quasi eine Erweiterung des Monitorings, und Monitoring-Daten sind eine Teilmenge der Observability-Daten. Vergleicht man beide miteinander, lässt sich feststellen, dass Observability-Tools weitaus mehr und wesentlich ausgefeiltere Methoden verwenden als Monitoring-Tools. Von diesen Schlüsselaspekten leiten sich die größten Unterschiede in Bezug auf Nutzung, Einsatzbereich und Fähigkeiten ab.
Monitoring | Observability | |
Fokus | Vergangenheit: Was ist geschehen? Reaktiv. | Prädiktiv: Warum und wie geschah es? Einblicke in mögliche zukünftige Probleme. Proaktiv. |
Problemlösung | Begrenzt. Erfordert Datenkorrelation und -analyse durch Mitarbeitende. | Umfassend. Verwendet AIOps zur Korrelation und Analyse riesiger Datasets, um umsetzbare Erkenntnisse zu liefern. |
Datenquellen | Metriken und Logs | Metriken, Events, Logs und Traces (MELT) sowie Informationen aus Application Performance Management (APM), Security & Event Information Management (SEIM), DEM und RUM. |
Effektivität | Begrenzt durch die Komplexität der Systeme. Große Datasets über verteilte Infrastrukturen hinweg verhindern schnelle menschliche Analyse. | Unbegrenzt mit AIOps und maschinellem Lernen, um in Echtzeit große Datenströme in der gesamten Infrastruktur zu verarbeiten und gleichzeitig aus diesen Daten zu lernen. |
Wann eignet sich Monitoring oder Observability besser?
Monitoring liefert Alerts, Logs und -visualisierungen in Echtzeit, damit Teams sofort auf Probleme reagieren können. Dashboards bieten klare, visuelle Einblicke, sodass Teams Probleme schnell erkennen. Wenn es um einfachste IT-Vorgänge und -Services geht, kann Monitoring mit konfigurierbaren Dashboards bereits eine effektive Lösung für ein Unternehmen sein.
Angesichts der zunehmenden Verbreitung von Multi-Cloud-, Hybrid- und cloudnativen Set-ups sowie verteilten Systemen und komplexen Tech-Stacks in Unternehmen hat die Bedeutung von Observability deutlich zugenommen, denn nur so kann sichergestellt werden, dass alles reibungslos und ohne Unterbrechungen läuft. Anderenfalls steigt die Gefahr, dass die Benutzerzufriedenheit leidet, die Anwendungs-Performance zu wünschen übrig lässt und es zu längeren Ausfallzeiten und höheren Kosten kommt. AIOps-gestützte Observability-Tools analysieren Metriken, Events, Logs und Trace-Daten aus der gesamten Infrastruktur eines Unternehmens, um die Grundursache eines Problems nahezu in Echtzeit zu ermitteln. Dank der detaillierten Einsicht in die gesamte Infrastruktur und Software können DevOps-, SRE- und SEIM-Teams Probleme schnell beheben.
Die Verzahnung von Observability und Monitoring
Kleine Firmen bis hin zu großen Unternehmen können sowohl von Monitoring als auch von Observability profitieren, um den Betrieb effektiver zu gestalten.
Monitoring ermöglicht Teams eine schnelle Reaktion auf kleinere, weniger komplexe Probleme. Sind Server komplett ausgelastet, sodass die Serviceverfügbarkeit gefährdet ist, können Alerts für eine schnelle Reaktion der SRE-Teams sorgen oder Automatisierungstools starten, die dann die Ressourcen aufstocken – bevor die Kundschaft irgendetwas mitbekommt.
Umgekehrt erfordern verteilte Infrastrukturen und die Notwendigkeit schneller, zuverlässiger Software-Releases tiefe Einblicke in Ihre Infrastruktur und Services und deren unterschiedliche Touchpoints. Tritt ein Problem wiederholt auf, kann Observability Ihnen die nötigen Einblicke geben, um die Grundursache zu finden und aus dem Weg zu räumen.
Die ANZ Bank nutzt Observability beispielsweise für den gesamten Lebenszyklus ihrer ANZ Mobile App, um sicherzustellen, dass die Technologie stets hochleistungsfähig ist. William Hill führte Observability-Tools ein, um die Performance der Systeme zu verfolgen, über die täglich 5,2 Millionen Transaktionen abgewickelt werden. Mithilfe von Observability konnten die Engineers bei William Hill die MTTR um 80 % verbessern und ihre kritischsten Prio-1-Incidents in weniger als 60 Minuten beheben.
Hier finden Sie weitere Beispiele dafür, wie Observability New Relic Kunden weiterhilft.
Observability und Monitoring in DevOps und SRE
DevOps- und SRE-Teams benötigen verwertbare Einblicke, um effektiv und effizient zu arbeiten. Monitoring und Observability liefern zusammen diese Einblicke und versetzen sie in die Lage, Problemen zuvorzukommen – und damit negative Auswirkungen auf Kund:innen zu verhindern.
DevOps kann sich mithilfe von Observability-Tools ein Bild machen, wie sich ihr Code auf alle Touchpoints über den gesamten Software-Lebenszyklus auswirkt. AIOps analysiert riesige Datensätze in Echtzeit über die gesamte Infrastruktur hinweg, um festzustellen, wo Software-Engpässe auftreten, und gibt Entwickler:innen die nötigen Einblicke, um ihre Programme zu optimieren. Sobald neue Code-Releases Signale generieren, kann Observability mit der Analyse beginnen und kritische Metriken zu Systemen und Softwareverhalten zurückgeben.
SRE-Teams erhalten vom Echtzeit-Monitoring sofortiges Feedback und können das Systemverhalten in verschiedenen Dashboards beobachten. Dank der Alerts können sie schnell reagieren, während Observability-Analysetools Daten in der gesamten Infrastruktur interpretieren, um die Ursachen von Problemen aufzudecken. Anhand der gewonnenen Erkenntnisse lassen sich die mittlere Zeit zur Untersuchung (Mean Time to Investigate; MTTI) und die MTTR reduzieren. Und um ein erneutes Auftreten solcher Probleme in Zukunft zu verhindern, können entsprechende Automatisierungstools entwickelt werden.
Aber nicht nur DevOps und SRE profitieren: Observability kann auch SEIM-Teams neue Erkenntnisse liefern, damit sie die digitalen Assets eines Unternehmens besser schützen können. DEM und RUM können Teams im digitalen Marketing und im Vertrieb aufzeigen, wie ihre Aktivitäten bei der Kundschaft ankommen und welchen Einfluss sie auf die Umsätze haben. Monitoring und Observability können tatsächlich dem gesamten Geschäftsbetrieb zugutekommen.
Nächste Schritte
Monitoring und Observability sorgen heute für resiliente Systeme und Services. Sie geben DevOps, SRE, SEIM und anderen Abteilungen eine datengestützte Methodik für den gesamten Software-Lebenszyklus an die Hand.
Werden sie gemeinsam eingesetzt, bringen Observability und Monitoring alle Telemetriedaten – Metriken, Events, Logs, Traces und zusätzliche Signale – in einer zentralen Datenplattform mit leistungsstarken Analysetools für den gesamten Stack zusammen. So können Teams Software und Services entwickeln, bereitstellen und ausführen, deren digitale UX wirklich überzeugt, was wiederum auch Innovation sowie geschäftliches Wachstum fördert.
Legen Sie gleich los und profitieren Sie von den leistungsstarken Tools für Observability und Monitoring von New Relic.
Die in diesem Blog geäußerten Ansichten sind die des Autors und spiegeln nicht unbedingt die Ansichten von New Relic wider. Alle vom Autor angebotenen Lösungen sind umgebungsspezifisch und nicht Teil der kommerziellen Lösungen oder des Supports von New Relic. Bitte besuchen Sie uns exklusiv im Explorers Hub (discuss.newrelic.com) für Fragen und Unterstützung zu diesem Blogbeitrag. Dieser Blog kann Links zu Inhalten auf Websites Dritter enthalten. Durch die Bereitstellung solcher Links übernimmt, garantiert, genehmigt oder billigt New Relic die auf diesen Websites verfügbaren Informationen, Ansichten oder Produkte nicht.