Die Aufrechterhaltung von Performance, Verfügbarkeit und Health der IT-Infrastruktur ist in der heutigen digitalen Landschaft von entscheidender Bedeutung. Hier kommt das Infrastruktur-Monitoring ins Spiel. Im Kern handelt es sich um ein System, das Echtzeit-Einblicke in Ihren gesamten Stack liefert, eine optimale Performance gewährleistet und potenzielle Probleme aufzeigt, bevor sie eskalieren. Von Clouddiensten bis hin zu On-Premise-Servern werden wir uns eingehend mit dem Infrastruktur-Monitoring, seiner Bedeutung, Funktionalität und seinen Auswirkungen auf moderne Unternehmen befassen. Legen wir los.

Was ist Infrastruktur-Monitoring?

Infrastruktur-Monitoring ist eine Software, die Ihnen hilft, Ihre gesamte Infrastruktur – einschließlich cloudbasierter Dienste, lokaler Hosts, orchestrierter Container und virtueller Maschinen – zu überwachen und Probleme schnell zu lokalisieren sowie zu beheben. Sie können Infrastruktur-Monitoring nutzen, um vollständige Observability für komplexe und hybride Systeme wie Rechenzentren sowie cloudbasierte Dienste wie Amazon Web Services (AWS) und Microsoft Azure zu schaffen. Sie können Infrastruktur-Monitoring auch verwenden, um sich einen umfassenden Überblick über CPU, RAM, Speicher und Netzwerktraffic Ihres Systems zu verschaffen. Mit diesen Einblicken können Engineers Performance-Probleme innerhalb von Servern, Containern, Kubernetes-Clustern, Datenbanken, On-Host-Diensten und mehr identifizieren und beheben, egal ob lokal oder in der Cloud. Infrastruktur-Monitoring liefert detaillierte Performance-Metriken, Trendwerte und Prognosen, anhand derer Unternehmen ihre Ressourcen optimieren, die Uptime verbessern und einen reibungslosen Service gewährleisten können.

Lesen Sie weiter, um mehr über das Infrastruktur-Monitoring zu erfahren, einschließlich der Gründe, warum es wichtig ist und worauf Sie bei einem Infrastruktur-Monitoring-Tool achten sollten.

Was ist die Anwendungsinfrastruktur?

Unter Anwendungsinfrastruktur versteht man alle Assets, die den Betrieb Ihres Systems und Ihrer Technologie ermöglichen, also Netzwerke, Hardwarekomponenten und Server, unabhängig davon, ob in der Cloud oder lokal. Selbst wenn Sie Cloudlösungen nutzen, befindet sich diese Infrastruktur noch immer auf einem physischen Server. Die Anwendungsinfrastruktur ist wie das Fundament eines Gebäudes – man kann es nicht sehen, aber es stützt das gesamte Gebäude.

Letztlich kann man sich die Anwendungsinfrastruktur als aus drei Schichten bestehend vorstellen:

  • Hardware: Die Hardware umfasst alle physischen Komponenten, die Ihre Infrastruktur hosten. Dazu gehören physische Server, Prozessoren, Netzwerkgeräte und andere physische Geräte, die Ihr System verwendet. Diese Schicht basiert letztendlich auf Mikrochips, einschließlich Logikchips (CPUs) und Speicherchips (RAM). Es gibt auch andere Arten von Chips, darunter Neuralprozessoren (NPUs), die für Anwendungen zum maschinellen Lernen konzipiert sind.
  • Betriebssystem (OS): Das Betriebssystem ist die Schnittstelle, die die beiden Schichten der Anwendungsinfrastruktur verbindet: die Hardware und die Anwendung selbst. Das Betriebssystem führt die Anwendung aus und nutzt gleichzeitig Hardware-Ressourcen wie CPUs und RAM. Dazu gehören auch virtuelle Maschinen, die über ein eigenes Betriebssystem verfügen.
  • Anwendung: Dies ist die Anwendung selbst. Dabei kann es sich um eine von Ihnen selbst entwickelte Anwendung oder um eine Anwendung handeln, die ein Content-Management-System wie WordPress verwendet. Die Anwendungsschicht umfasst auch Container, die zum Ausführen vieler Anwendungen verwendet werden.
ZENHUB – FALLSTUDIE
ZenHub logo
Zenhub nutzt New Relic, um einen komplexen Tech-Stack in den Griff zu bekommen
So nutzte Zenhub New Relic Infrastruktur-Monitoring So nutzte Zenhub New Relic Infrastruktur-Monitoring

Wenn Sie lokale Server verwenden, müssen Sie all diese Schichten berücksichtigen und sicherstellen, dass Ihre Hardware ordnungsgemäß funktioniert. Mit einer cloudbasierten Infrastruktur müssen Sie sich nicht mehr in gleicher Weise um die Hardware kümmern, da Ihr Cloudanbieter die Infrastruktur unterhält, die Ihre Software und Anwendungen hostet. Sie müssen jedoch immer noch über die Bereitstellung und Dimensionierung von Ressourcen nachdenken – CPU, Arbeitsspeicher, Speicherplatz und Netzwerk. Wenn Ihre Anwendung unterdimensioniert ist, funktioniert sie nicht ordnungsgemäß. Wenn Ihre Anwendung jedoch überdimensioniert ist, verschwenden Sie Geld für Kapazitäten, die Sie nicht benötigen.

Das nächste Bild zeigt ein Dashboard im New Relic Explorer mit einer Übersicht der Container, Services, Hosts und mehr.

How does infrastructure monitoring work?

Like other types of monitoring, infrastructure monitoring usually involves instrumenting a host by installing an agent. In the case of a monitoring solution like New Relic, you can begin the process of instrumentation with a simple guided installation. The agent automatically detects the application and log sources running in your environment and then recommends which ones you should instrument.

Once your hosts are fully instrumented, the agent will collect system data and send it to your infrastructure monitoring solution. In some cases, the agent will forward data and logs, particularly in the case of integrations.

The following chart shows how a New Relic on-host integration receives data from a service like Redis or Apache.

Warum ist Infrastruktur-Monitoring wichtig?

Unabhängig davon, ob Ihre Anwendung cloudbasierte oder On-Premise-Hosts (oder beides) verwendet, bildet die Infrastruktur die Grundlage für Ihr System. So wie ein Zug nur auf gut gewarteten Gleisen verkehren kann, benötigt Ihr System leistungsstarke, zuverlässige Server, damit sichergestellt ist, dass die Dienste Ihren Benutzer:innen zuverlässig zur Verfügung stehen. Wenn Teile der Infrastruktur nicht funktionieren, leidet die Performance Ihrer Anwendung und es kann sogar zu Ausfällen kommen. Da so viel auf dem Spiel steht, kann die Pflege der Infrastruktur sowohl herausfordernd als auch stressig sein. Selbst wenn Ihre Server eine Uptime von nahezu 100 % haben, können Ausfälle, wenn sie denn vorkommen, schwerwiegend sein. Ausfälle und Downtime wirken sich auf Ihren Ruf und das Vertrauen Ihrer Benutzer:innen aus. Im besten Fall können Ihre Benutzer:innen während eines Ausfalls nicht auf Ihre Dienste zugreifen, und im schlimmsten Fall wenden sie sich frustriert ab und kehren nicht zurück.

Während das Monitoring von Komponenten wie System-CPU und -RAM über eine Betriebssystem-Befehlszeile erfolgen kann, benötigen Sie eine umfassendere Lösung für das Monitoring der Anwendungsinfrastruktur, insbesondere wenn Ihre Anwendungen größer und komplexer werden. Hier kommen Infrastruktur-Monitoring-Tools ins Spiel. Mit einem Infrastruktur-Monitoring-Tool wie New Relic können Sie die Infrastruktur Ihres gesamten Systems inklusive Metriken, Events, Logs und Traces (MELT) von einem zentralen Ort aus visualisieren.

Infrastruktur-Monitoring ist nur ein Teil einer umfassenden Observability-Praxis. Bei Observability geht es um die proaktive Erfassung und Visualisierung der Daten in all Ihren Systemen, einschließlich Ihrer Infrastruktur, sowie um das damit zusammenhängende Alerting. Idealerweise sollte die von Ihnen verwendete Plattform auch andere Aspekte Ihrer Anwendung überwachen, z. B. die App-Performance. Auf diese Weise können Sie Fehler, die in Ihrer Infrastruktur und an anderer Stelle in Ihrer Anwendung auftreten, lokalisieren und beheben.

Vorteile des Infrastruktur-Monitorings:

  • Ausfälle und andere Infrastrukturprobleme finden und beheben Sie schnell.
  • Sie unterstützen Ihre Engineering-, DevOps- und IT-Teams, die mit der Anwendungsinfrastruktur arbeiten und darauf angewiesen sind.
  • Sie bieten Endbenutzer:innen ein konsistentes, positives Nutzererlebnis, was sich wiederum positiv auf Ihre Bilanz auswirkt.

 

Was können Sie mit einer Infrastruktur-Monitoring-Lösung überwachen?

Mit einer Infrastruktur-Monitoring-Lösung können Sie alle Teile Ihrer Anwendungsinfrastruktur überwachen. Im Fall von New Relic gehört dazu standardmäßig Folgendes, sobald Ihre Infrastruktur instrumentiert ist:

  • Der aktuelle Status des Servers, einschließlich CPU, Speicher, Festplatte und Netzwerk. 
  • Die Nutzung und Kapazität eines mit dem Server verbundenen Speichergeräts.
  • Die Nutzungsdaten für jedes mit dem Server verknüpfte Netzwerkgerät.
  • Daten zu allen Docker-Containern und Kubernetes-Clustern, einschließlich Metriken zu CPU, Speicher und Netzwerk.
  • Alle Änderungen im Live-Status eines Systems, der in einem InfrastructureEvent gespeichert wird.

Zusätzlich zur Instrumentierung können Sie die Integrationen auch für Datenanalyse, -visualisierung und -Alerting in anderen Teilen Ihrer Infrastruktur verwenden. New Relic verfügt über zwei Hauptkategorien an Infrastrukturintegrationen:

Eine Plattform für das Infrastruktur-Monitoring sollte auch genügend Flexibilität für Ihre eigenen Custom-Lösungen bieten. Sie können sogar die Infrastruktur in Ihrem Zuhause überwachen. So nutzte ein Engineer New Relic beispielsweise zum Monitoring seiner heimischen Solaranlage.

Das nächste Bild zeigt ein Beispiel für das Monitoring von Kubernetes-Clustern im New Relic Explorer.

Metriken für das Infrastruktur-Monitoring

Infrastruktur-Monitoring-Metriken geben Aufschluss über die Performance und Zuverlässigkeit Ihres Systems. Dies sind einige häufig verwendete Metriken:

CPU-Metriken

  • CPU-Nutzung
  • Durchschnittliche CPU-Auslastung
  • CPU-Leerlaufzeit
  • CPU-Wartezeit

Speichermetriken

  • Gesamtspeicher
  • Verwendeter Speicher
  • Freier Speicher
  • Speicherseitentausch

Festplattenmetriken

  • Festplatten-Lese-/Schreibraten
  • Festplatten-E/A
  • Festplattenauslastung
  • Festplattenkapazität

Infrastruktur-Health

  • Uptime/Downtime
  • Systemverfügbarkeit
  • Hardwarefehler
  • Service-/Prozessstatus

Diese Liste erhebt keinen Anspruch auf Vollständigkeit und die Metriken können je nach Infrastruktur variieren. Dennoch vermittelt diese Auflistung ein grundlegendes Verständnis der Metriken, die für das Monitoring Ihrer Infrastruktur unerlässlich sind.

Use Cases fürs Infrastruktur-Monitoring

Das Infrastruktur-Monitoring fungiert als Augen und Ohren von IT-Teams und bietet Einblicke, die sich über verschiedene operative Szenarien erstrecken, zum Beispiel:

  • Proaktive Problemerkennung: Bevor ein kleiner Fehler zu einem gravierenden Ausfall eskaliert, können Infrastruktur-Monitoring-Tools die Administrator:innen benachrichtigen, damit diese Maßnahmen ergreifen.
  • Monitoring von Website-Uptime und -Performance: Monitoring-Tools können den Zustand des Webservers, die Reaktionsschnelligkeit der Datenbank und sogar das Endbenutzererlebnis in Echtzeit überwachen.
  • Kapazitätsplanung: Sie können historische Daten analysieren, um vorherzusagen, wann die Infrastruktur möglicherweise an ihre Grenzen stößt.
  • Compliance: Durch kontinuierliches Monitoring und Logging erhalten Sie einen detaillierten Audit-Trail, um sicherzustellen, dass Compliance-Standards eingehalten werden.
  • Feedback nach dem Deployment: Für Unternehmen, die DevOps-Praktiken einführen, bietet Monitoring die Option zum Post-Deployment-Feedback, sodass etwaige Ineffizienzen leichter erkannt werden können.

Wie funktioniert Infrastruktur-Monitoring?

Wie andere Monitoring-Typen erfordert auch Infrastruktur-Monitoring in der Regel die Instrumentierung eines Hosts durch die Installation eines Agent. Im Falle einer Monitoring-Lösung wie New Relic können Sie die Instrumentierung mit einer einfachen geführten Installation beginnen. Der Agent erkennt automatisch die in Ihrer Umgebung ausgeführten Anwendungs- und Logquellen und empfiehlt dann, welche Sie instrumentieren sollten.

Sobald Ihre Hosts vollständig instrumentiert sind, sammelt der Agent Systemdaten und sendet sie an Ihre Infrastruktur-Monitoring-Lösung. In einigen Fällen leitet der Agent Daten und Logs weiter, insbesondere bei Integrationen.

Das folgende Diagramm zeigt, wie eine New Relic On-Host-Integration Daten von einem Dienst wie Redis oder Apache empfängt.

NEW RELIC INFRASTRUKTUR-MONITORING
Image of stacked rows of black, shiny, 3-D hexagons

Wie andere Monitoring-Typen umfasst auch das Infrastruktur-Monitoring MELT-Daten – Metriken, Events, Logs und Traces.

Logs sind einzelne Aktionen, die in einer Anwendung stattfinden, und stellen die Bausteine von Metriken, Events und Traces dar. Sie bestehen aus einzelnen Textzeilen. Beispielsweise loggt ein NGINX-Server alle auftretenden Transaktionen. Ein Event kann aus vielen Zeilen an Logdaten bestehen. Zusammen mit Traces, die Events miteinander verbinden, bieten Events mehr Kontext zu den Vorgängen in Ihrer Infrastruktur.

Bei den Metriken schließlich handelt es sich um aggregierte Daten, die Ihnen einen umfassenden Überblick über die Vorgänge in Ihrer Anwendung geben. Ein Beispiel ist die durchschnittliche Latenz eines Dienstes in den letzten sieben Tagen. Metriken zeichnen ein Gesamtbild für Sie und sind besonders hilfreich bei der Visualisierung von Health und Performance Ihrer gesamten Infrastruktur. Es ist auch wichtig zu wissen, wie Störungen der Infrastruktur ins Spiel kommen, da der proaktive Einsatz von Technologie zur Förderung von Geschäftsinnovationen immer wichtiger wird.

Best Practices fürs Infrastruktur-Monitoring

  • Verfolgen Sie einen ganzheitlichen Ansatz: Gehen Sie über das Monitoring einzelner Komponenten hinaus und berücksichtigen Sie das gesamte Infrastruktur-Ökosystem, einschließlich Server, Datenbanken, Netzwerkausrüstung und Anwendungen.
  • Richten Sie umfassende Alerts ein: Mit dem richtigen Alert-System können reaktive Teams zu proaktiven werden. Wählen Sie strategisch aus, worüber Sie benachrichtigt werden möchten.
  • Überprüfen Sie regelmäßig die Metriken und erfassten Daten: Stellen Sie sicher, dass Ihre Tools und Monitoring-Parameter auch bei der Weiterentwicklung Ihrer Infrastruktur relevant bleiben.
  • Test Test Test: Durch das Testen Ihrer Infrastruktur unter Hochlastbedingungen werden potenzielle Schwachstellen aufgedeckt und echte Katastrophen umschifft.
  • Erstellen Sie Infrastruktur-Monitoring-Dashboards für Ihr Team: Ein Infrastruktur-Monitoring-Dashboard ist eine zentrale Anlaufstelle, mit der Sie den Status Ihres aktuellen Systems im Blick behalten. Nutzen Sie sie, um Probleme zu besprechen, zu analysieren und gemeinsam zu bearbeiten und gleichzeitig ein kollektives Verständnis der Infrastruktur-Performance zu erlangen.

Wählen Sie das richtige Infrastruktur-Monitoring-Tool: Entscheiden Sie sich für ein Tool, das zu den Bedürfnissen, der Größe und den Zielen Ihres Unternehmens passt. Vergessen Sie nicht, Benutzererlebnis, Integrationsfeatures, Zuverlässigkeit und Kosteneffizienz zu berücksichtigen.

Gründe für das Monitoring von Infrastruktur mit New Relic

Tauchen Sie mit New Relic in die Zukunft von Infrastruktur-Monitoring und Observability ein. Unsere Plattform bietet nicht nur allen Engineers über 30 Toolsets in den Bereichen APM, Infrastruktur und mehr, sondern verfügt auch über ein nutzungsabhängiges Preismodell, das Lizenzgebühren pro Benutzer eliminiert. Dies bedeutet, dass Sie Ihre Betriebskosten effizienter verwalten und gleichzeitig all Ihren Engineers die Tools zur Verfügung stellen können, die sie benötigen.

Kostengünstige und transparente Preisgestaltung

Konsolidieren Sie Ihr Toolset und behalten Sie die Kosten bei einer Skalierung im Griff. Mit dem nutzungsabhängigen Preismodell von New Relic können Sie im Vergleich zu Datadog bis zu zwei Drittel an Kosten sparen. Einen detaillierten Vergleich finden Sie in unserem Blogpost New Relic vs. Datadog: Der Vergleich.

Brechen Sie Datensilos auf, um Probleme schnell zu beheben

Verabschieden Sie sich von Datensilos. New Relic verbindet Ihre APM- und Infrastrukturdaten und bietet uneingeschränkte Transparenz im gesamten Stack. Dieser umfassende Überblick ermöglicht es Teammitgliedern, Performance-Probleme bis zu 80 % schneller zu beheben, unabhängig davon, welchem Team sie angehören.

Nahtlose Zusammenarbeit zwischen Teams

Unsere zentrale Observability-Plattform dient als Single Source of Truth und ermöglicht Engineers aller Teams eine effiziente Zusammenarbeit, wenn Probleme auftreten. Es sind keine zusätzlichen Tools erforderlich und es besteht keine Notwendigkeit, den Einkauf zu involvieren, um Benutzer:innen oder SKUs hinzuzufügen.

Starten Sie noch heute

Melden Sie sich für die kostenlose Produktvariante von New Relic an und tauchen Sie tiefer in unsere umfassende Infrastruktur-Monitoring-Dokumentation sowie unsere Best Practices ein. Sammeln Sie praktische Erfahrungen mit unserem Tutorial zum Ermitteln grundlegender Fehlerursachen in Ihrer Infrastruktur („Identify Root Cause Issues in Your Infrastructure“).

 

Erleben Sie noch heute, wie einzigartig New Relic ist, und krempeln Sie das Monitoring und Optimieren Ihrer Infrastruktur komplett um.