Amazon CloudWatch Internet Monitor ist ein Service, der aufzeigt, wie sich Internetprobleme auf die Performance und Verfügbarkeit Ihrer auf Amazon Web Service (AWS) gehosteten Anwendungen auswirken. New Relic ist eine Observability-Komplettlösung, die Monitoring, Logging und Tracing über den gesamten Tech-Stack hinweg vereinheitlicht. Durch Echtzeiteinblicke und -analysen hilft New Relic Unternehmen, optimale Leistung, Zuverlässigkeit und Benutzerfreundlichkeit sicherzustellen. 

New Relic gibt heute eine neue Integration für Amazon CloudWatch Internet Monitor bekannt, mit der Kund:innen eine einheitliche, umfassende Lösung für das Monitoring aller Anwendungen und Infrastruktur-Telemetriedaten erhalten. Diese Integration vereinfacht das Management moderner Anwendungen und Infrastrukturen und trägt so zu besseren Geschäftsergebnissen bei. Durch die Bereitstellung von Live-Einblicken in die Internetleistung und -verfügbarkeit können Unternehmen Probleme, die das Nutzungserlebnis beeinträchtigen, schnell erkennen und beheben.

Einrichtung

Wir haben zwei Optionen zum Reporting von Metrikdaten. Die bevorzugte Methode ist die Einrichtung unserer Integration für Amazon CloudWatch Metric Streams. Alternativ können Sie aber auch unsere ältere Amazon-Integration wählen, die Polling verwendet. 

Logdaten können mithilfe unserer Lambda-Funktion zur Logerfassung an New Relic gemeldet werden. Fügen Sie der Lambda-Funktion Trigger hinzu und wählen Sie die entsprechende Loggruppe für „internet-monitor“ auf den Ebenen „country“, „city“, „subdivision“ und „metro“. 

Beobachtung

Dank der leistungsstarken Dashboards und Alertingsysteme von New Relic können Teams Probleme schnell erkennen und beheben, wodurch Downtime reduziert und die betriebliche Effizienz verbessert wird. Durch Nachverfolgung von IP-Präfixen, AS-Nummern (AS=autonomes System), Latenz, Verfügbarkeit, Health-Events, geografischen Daten und Traffic-Mustern bietet New Relic Echtzeiteinblicke in die Health von Internetdiensten. 

Amazon CloudWatch Internet Monitor liefert verschiedene Telemetrie- und Datenpunkte. 

  • Health-Event: Wenn Internet Monitor signifikante Performance-Einbußen beim Traffic feststellt, erstellt es ein Health-Event. Jedes Health-Event enthält Informationen über die betroffenen Kundenstandorte und Internetanbieter (ISPs).
  • Performance- und Verfügbarkeitsbewertungen (Health-Scores): Eine statistische Einschätzung des Prozentsatzes an Traffic zu Ihrer Anwendung, bei dem keine Performance- bzw. Verfügbarkeitseinbußen zu verzeichnen sind. Diese Werte sind auch als CloudWatch-Metriken verfügbar.
    • Ein Verfügbarkeitswert stellt den geschätzten Prozentsatz des Traffics dar, bei dem sich die Verfügbarkeit nicht verschlechtert. Anhand des tatsächlichen lokalen Datenverkehrs und der gemessenen Verfügbarkeitsmetriken schätzt Internet Monitor den prozentualen Anteil des Traffics ein, bei dem es zu einem Datenverlust kommt. Ein Verfügbarkeitswert von 99 % für eine aus Endbenutzer:in und Service-Standort bestehende Paarung entspricht beispielsweise 1 % des Traffics, bei dem es für diese Paarung zu Verfügbarkeitseinbußen kommt.
    • Ein Performance-Wert stellt den geschätzten Prozentsatz des Traffics dar, bei dem sich die Performance nicht verschlechtert. Ein Performance-Wert von 99 % für eine aus Endbenutzer:in und Service-Standort bestehende Paarung entspricht beispielsweise 1 % des Traffics, bei dem es für diese Paarung zu Leistungseinbußen kommt.
  • Übertragene Bytes und überwachte übertragene Bytes (Bytes Transferred und Monitored Bytes Transferred): Bei den übertragenen Bytes handelt es sich um die Gesamtzahl der ein- und ausgehenden Bytes an Traffic zwischen einer Anwendung in AWS und dem City-Netz (d. h. dem Standort und der AS-Nummer, in der Regel dem Internetanbieter), über das Kund:innen auf eine Anwendung zugreifen. Überwachte übertragene Bytes ist eine ähnliche Metrik, sie umfasst aber nur Bytes für überwachten Traffic.
  • Round-Trip Time (RTT): Die Round-Trip Time ist die Zeitspanne, die zwischen dem Stellen einer Benutzeranfrage und dem Empfang der Antwort vergeht. Ist die RTT über verschiedene Kundenstandorte (Städte oder andere Regionen) aggregiert, wird der Wert je nach Anwendungstraffic an den einzelnen Standorten gewichtet.

Alerts wie eine niedrigere Performance oder Verfügbarkeit können in Tools wie Slack, PagerDuty usw. integriert werden.