Abo erforderlich
Erhalten Sie Zugang zu exklusivem Content.
Success! Here it comes.
Content automatically in 3...

0
Mit Ihrer Registrierung stimmen Sie unseren Nutzungsbedingungen und unserer Datenschutzerklärung​ zur.

Das Netzwerkteam von New Relic überwacht die eigene globale Netzwerkumgebung. Diese umfasst Hunderte von Zellen mit Kubernetes-Clustern, die wiederum mit mehreren Cloudumgebungen verknüpft sind. Für umfassende Visibility entwickelten SREs und Netzwerk-Engineers Code mithilfe von New Relic Bibliotheken, die in jedem Cluster bereitgestellt werden, um wichtige Netzwerktelemetrie zu sammeln.

Die Hauptmotivation für den Aufbau dieser umfassenden Netzwerk-Observability bestand darin, der Kundschaft einen besseren Überblick über das Netzwerk zu vermitteln und Vertrauen aufzubauen. Letztendlich sollen andere Teams in die Lage versetzt werden, sich selbst zu helfen und beim Troubleshooting als Erstes Netzwerkprobleme auszuschließen. 

Die benutzerdefinierten Netzwerk-Dashboards bieten tiefe Einblicke in zahlreiche Metriken, z. B.:

  • Netzwerkleistung: Monitoring von Bandbreite, Paketverlust, Jitter, Latenz und Pfadnutzung.
  • Infrastruktur-Health: Verwenden des Infrastructure Agent mit Amazon- und Azure-Konnektoren, um Informationen von diesen Plattformen abzurufen und in New Relic aufzunehmen.
  • Konnektivitätsvalidierung: Verwenden eines benutzerdefinierten Skripts, mit dem die Konnektivität zwischen zwei Orten durch Pingen geprüft wird.
  • Kostenoptimierung: Monitoring eines NAT-Dienstes (Egress Network Address Translation), um das Netzwerk eines Cloudanbieters zu einem deutlich niedrigeren Preis zu verlassen, und Überwachung auf unerwartete Kostenspitzen.

Die Implementierung dieser Netzwerk-Observability hatte tiefgreifende Auswirkungen auf die betriebliche Effizienz und Zuverlässigkeit von New Relic:

  • Deutlich schnellere Fehlerbehebung: Dank der Implementierung erhalten die Netzwerkteams jetzt deutlich weniger Alarmrufe. Durch Netzwerk-Observability wurde beispielsweise ein Routing-Problem festgestellt, bei dem der Traffic aufgrund einer fehlenden statischen Route per Failover auf eine unterdimensionierte Backup-Lösung umgeschaltet wurde. Die New Relic Netzwerkteams waren daher in der Lage, das Problem schnell zu beheben und später ein Active/Active-Setup für die Routen der Cloudanbieter zu implementieren, um den Traffic auszugleichen und eine Überlastung zu verhindern.
  • Proaktive Erkennung von Fehlkonfigurationen: Durch die Erkennung von Problemen wie fehlenden statischen Routen optimiert New Relic die Ressourcennutzung und erhöht die Systemzuverlässigkeit erheblich. Und das spart Geld.
  • Dynamische Runbooks: Letztendlich sollen andere Teams in die Lage versetzt werden, sich selbst zu helfen und beim Troubleshooting als Erstes Netzwerkprobleme auszuschließen.
  • Einblicke für Führungskräfte: Das Team verwendet New Relic auch zur Kostenoptimierung, und zwar durch Monitoring eines Egress-NAT-Dienstes. Zudem achtet das Team auf unerwartete Kostenspitzen und hilft anderen Teams, Probleme zu identifizieren und zu beheben, die die Datentraffic-Kosten unnötig erhöhen.
New Relic Now Demo der neuen Agentic-Integrationen – heute!
Jetzt ansehen.