Mehr Wirkkraft hinter den Kulissen der CX

Kaum eine Handvoll Monate dauert sie, doch auf ihr scheint der Druck eines ganzes Jahres zu lasten: Die Shopping-Saison verlangt dem Handel alles ab.

So gilt es, Ihre Marke stets im besten Licht zu präsentieren – insbesondere auch auf dem Display Ihrer Kund:innen, der heute wichtigsten Warenauslage überhaupt. Wie dies gelingt, haben wir in Teil 1 dieses E-Book-Zweiteilers beleuchtet.

Daher werfen wir nun einen Blick auf die Infrastruktur und operativen Abläufe hinter den Kulissen, die all dies erst möglich machen.

Mit dem Startschuss zur Shopping-Saison ist Hochdruck angesagt: Explodierender Web-Traffic und (im Idealfall) Rekordumsätze bedeuten für ihre Infrastruktur Schwerstarbeit.

Wie sie diese meistern und dabei auch Ihre Kund:innen zufriedener machen kann, beleuchten wir im Folgenden.

Hinter den Kulissen der CX

Das für Kund:innen auf dem Display Sichtbare ist letztlich das Ergebnis von Höchstleistungen der Engineering-Teams. Als „Bühnenbauer“ der CX sind sie es, die die von den Marketing- und Product-Teams erdachte Aufführung möglich machen. Die differenziertesten und ansprechendsten Digital-Auftritte sorgen jedoch für eine enge Zusammenarbeit und Abstimmung beider Bereiche: Bei führenden Einzelhandelsmarken gehen diese Werbekampagnen unisono einher mit Feature-Releases und Maßnahmen, die zugrunde liegende Plattformen für den User-Ansturm robust machen.

So fußen herausragende Kundenerlebnisse auf:

Engineering-Teams mit der Fähigkeit, Probleme auszumachen und zu beheben, bevor sie sich auf Kundenseite bemerkbar machen. Die Kontrolle über die CX verbleibt also immer beim Unternehmen selbst.

Auf Skalierbarkeit und Effizienz ausgelegter Software, Infrastruktur und Cloud-Investitionen. So kann auf veränderte Kundenanforderungen mit adäquaten Feature-Entwicklungen und Innovationen reagiert werden.
Dies wiederum erreichen Einzelhändler, indem sie hinter den Kulissen für effiziente Abläufe im Sinne von Uptime, Performance und Ausfallsicherheit sorgen.

Uptime, Performance, und Ausfallsicherheit

Aus diversen Beispielen im Kundenkontext ist festzustellen: Die Websites großer Einzelhandelsmarken halten dem Ansturm der Hochsaison oft nicht stand. So fatal solche Ausfälle sind, so grundlegend verändert haben sich in den vergangenen Jahren ihre Ursachen. Zugleich aber auch die Möglichkeiten für ihre Prävention.

Vielfach setzt man hierfür auf die Cloud ob ihrer Flexibilität, bei Bedarf schnell skalieren zu können. Hierauf eingegangen sind wir mit Bezug auf die britische Einzelhandelsgruppe Marks & Spencer in Teil 1 dieses E-Book-Zweiteilers: Gestützt auf die Cloud konnte das Unternehmen seine Strategie rund um Digital-First vorantreiben. Analog dazu gehen Ausfälle auf falsche Entscheidungen betreffend der Infrastruktur zurück, die sich durchaus einfach auch unternehmensintern würden vermeiden lassen. Was aus verschiedenen Gründen jedoch nicht erfolgte.

Denn häufig kommt es nur deshalb so weit, weil Engineering-Teams das nahende Problem nicht voraussehen konnten oder sich seiner Auslöser nicht bewusst waren. Die Vorzeichen hierfür lassen sich tatsächlich jedoch bereits weit im Vorfeld etwa aus Mustern aus dem Sommerschlussverkauf ableiten. Die zugehörigen Metrics liefern dabei die nötigen Anhaltspunkte, um der Katastrophe zu Peak-Zeiten wie dem Black Friday vorzubauen.

PRAXISBEWÄHRTE METHODIK: Absolut essenziell für das Bestehen im digitalen Kontext ist die Stabilität der Plattformen – im Einzelhandel tatsächlich noch mehr als in anderen Branchen. Durch Synergien zwischen Feature-Delivery und Ausfallsicherheit werden dabei auch Neuerungen nicht zum Stabilitätsrisiko. Als De-facto-Standard hierfür gelten heute Continuous Delivery oder daran angelehnte Engineering-Methodiken.

Warnsignale, die es zu beachten gilt

Ohne Klarheit darüber, was sich im Vordergrund der CX abspielt, lässt sich ihr Erfolg nur äußerst bedingt von hinter den Kulissen aus beeinflussen.

Dennoch herrschen in vielen Unternehmen noch die alten Silostrukturen vor: Engineering-Teams sitzen gewissermaßen in einer „Blase“, in der es einzig um Produktionszyklen geht und keinerlei Einblicke in an Kund:innen gerichtete Prozesse bestehen. Zugleich fehlt es den an sie gestellten Anforderungen an Kenntnis um ihre Delivery-Methodiken. Ein Umstand, der leider vielfach noch mehr Norm denn Ausnahme ist.

Was jedoch nicht so bleiben muss, wie etwa Unternehmen wie Marks & Spencer, FARFETCH, BT Shop oder Tabalat zeigen. Mit Observability als strategisches Narrativ gelang es ihnen, Engineering-Teams eng in Business-Prozesse einzubinden und so auch als Gesamtunternehmen weitaus effektiver zu operieren.

Klare Anzeichen für Handlungsbedarf in dieser Hinsicht sind:

Stark verzögerte Behebung von Incidents: Zugehörige Vorzeichen werden nicht erkannt, Probleme erst lange nach ihrem Eintreten festgestellt oder ihre Ursache nicht rasch genug ermittelt.
Komplexe Abläufe: Teams wird der schnellste oder beste Weg zu Ergebnissen versperrt (was letztlich in Frust mündet).
Häufige Ausfälle nach Deployments: Dies trotz größter Sorgfalt seitens der Dev-Teams.
Reaktive und somit zeitaufwändige Problembehebung: Mangels Mechanismen zur Früherkennung ist keine Prävention möglich, zudem fehlt es an aussagekräftigen Daten zur Entwicklung neuer Strategien.
Fragmentiertes Tooling und Datensilos: Voneinander isolierte Technologien lassen sich nicht zielführend genug nutzen und liefern nur lückenhafte Visibility.

Diese Problematiken sind einzeln oder auch im Ganzen tatsächlich weit verbreitet. Kein Wunder also, dass viele Engineering-Teams Observability geradezu als Offenbarung empfinden.

Erfolgsfaktoren

Höhere Mächte sind dabei allerdings weniger im Spiel. Vielmehr sind es Telemetriedaten bzw. deren zielführende Nutzung, die Observability möglich machen. Einzelhändler, die hierfür unsere Technologien einsetzen, konnten so grundlegende Veränderungen anstoßen und schließlich die für intelligentere und dynamischere Abläufe zentralen Prozesse optimieren.

Auf Ihrem Weg dorthin sollte Ihr erster Fokusbereich der Ausfallsicherheit gelten. Es geht darum, die Auswirkungen potenzieller Incidents feststellen zu können, Problemursachen schneller aufzudecken und diese in kürzerer Zeit zu beheben.

So nutzen Sie Telemetriedaten optimal:

Leiten Sie aus ihnen die geschäftlichen Auswirkungen von Problemen ab. Durch Direkteinsicht in Daten zum jüngsten Incident können Sie bemessen, wie sich künftige Schwachstellen auf Ihre Kund:innen, Teams und Partner auswirken werden.
Zeigen Sie mit ihrer Hilfe optimal auf, wie technische und geschäftliche Probleme miteinander verknüpft sind. So richten Sie den Fokus aller Unternehmensbereiche darauf, Sie optimal bei Ihrer Arbeit zu unterstützen.
Lesen Sie aus ihnen ab, wir Ihr Unternehmen auf ein Problem aufmerksam wurde, und justieren Sie Ihre Alerting-Parameter und Dashboards danach. In keinem Fall dürfen Probleme bis zu Ihren Kund:innen durchdringen.
Ziehen Sie Workflows auf, nach denen Sie Maßnahmen zur Behebung von Problemen formalisieren, ihren Zeitaufwand quantifizieren und ermitteln, wie sich die jeweils betroffenen Bereiche widerstandsfähiger machen lassen. Kein Problem wird am Endpunkt gelöst: Sie müssen seine Ursache erfassen, wie Sie darauf aufmerksam wurden und wie Sie Ihren Stack optimieren können.

Eine solche End-to-End-Methodik ist im Einzelhandel heute Usus, der erste Schritt dorthin die Fähigkeit, Probleme noch vor oder direkt bei ihrem Auftreten auszumachen. Darauf folgen muss dann eine schnelle Behebung einschließlich kontinuierlicher Optimierung, damit jedem Incident letztlich auch ein Gewinn gegenübersteht.

WICHTIGSTE METRICS: Für Engineering- und Business-Teams gleichermaßen mit weitreichenden Vorteilen verbunden sind starke Ergebnisse bei folgenden Metrics:

Kundenbezogen: Kundenzufriedenheit, Marktwahrnehmung, Warenkorbwert, Vorlaufzeit zum Kaufabschluss

Businessbezogen: Uptime, Verfügbarkeit, MTTD/MTTR, MTBF, Personalfluktuation, Talentbindung, Abwicklungskosten

Technologiebezogen: Service-Level-Erfüllung, Anzahl, Dauer und Bearbeitungsrate von Incidents, Auslastung

Betriebliche Effizienz

Produkte schneller am Markt positionieren, flexibler skalieren, Auf- und Abwärtstrends in der Nachfrage nachvollziehen: In Erwartung dieser Vorteile migrieren viele Einzelhändler traditionelle Workloads in die Cloud. Diese Value-Versprechen in großem Maßstab realisierbar zu machen, ist nun die Aufgabe ihrer Engineering-Teams. In einer derart hart umkämpften Branche muss dies jedoch auch mit Kosteneinsparungen einhergehen.

Zwar ist der Schritt in die Cloud in aller Regel strategisch wie auch wirtschaftlich ratsam. Dies jedoch nicht immer auch mit Blick auf einen adäquaten prozesstechnischen Unterbau, der die nötige Transparenz für die Infrastruktur liefern würde. Die tatsächlichen Anforderungen lassen sich dann nicht klar abbilden; es entstehen Ineffizienzen.

PRAXISBEWÄHRTE METHODIK: Führende Einzelhändler legen Cloud-Investitionen einen korrelierten Kontext aus Business- und Tech-Zielen zugrunde, bestimmen so die optimale Dimensionierung auf Grundlage von für alle Beteiligten nachvollziehbaren Metrics. Hierfür unabdingbar ist umfassendes Monitoring für eine lückenlose Sicht auf die gesamte Cloud-Infrastruktur.

Warnsignale, die es zu beachten gilt

Im Kontext des passenden Business-Case bringt die Cloud zweifelsohne weitreichende Vorteile. Doch dafür bedarf es mehr als nur einer Handvoll entsprechender Lizenzen: Jeder einzelne Fachbereich muss strategisch wie auch kulturell umfassend einbezogen sein.

Andernfalls werden Sie sich in Aussagen wie den Folgenden wiedererkennen:

Wir wissen, wir nutzen unsere Infrastruktur und Cloud-Ressourcen wenig effizient. Klar erfassen oder quantifizieren können wir die Problematik aber ebenso wenig,

da unser Monitoring dies nicht leisten kann.

So schleppend wie die Migration bislang verläuft, haben sich für uns bislang kaum Vorteile in punkto Skalierung erschlossen.
Fragmentierte Tooling-Landschaften und redundante Datenquellen bremsen uns aus.
Die Behebung einzelner Probleme bindet zu viele Personalressourcen, als dass wir noch agil operieren oder unsere Engineering-Teams unabhängig agieren könnten.
Sicher könnten wir diesen Problemen mit Observability auf den Grund gehen. Nur lässt sie sich bei uns nicht ohne spezifisches Know-how umsetzen.

Diese Auswahl klassischer Probleme von Einzelhändlern rund um ihre Cloud-Ambitionen macht deutlich: Auf die großen Erwartungen am Anfang kann allzu leicht die Ernüchterung folgen, sich in eine Sackgasse manövriert zu haben.

Erfolgsfaktoren

Wer aber hinter den Kulissen an den richtigen Stellschrauben dreht, wird dafür sowohl intern als auch im Kundenkontext reich mit Vorteilen belohnt. Und das ganz ohne komplizierte Kunststücke. Um neue Potenziale für Value und Performance zu erschließen, braucht es lediglich ein neues Denken. Genau hierzu kann Observability die Türen öffnen.

Mit Blick auf die operative Effizienz geht es hierbei um:

Lückenlose Visibility in Ihre komplette Cloud-Infrastruktur: So können Sie Tech- und Business-Ziele zueinander in Kontext setzen. New Relic unterstützt hierbei zahlreiche Unternehmen mit einer Komplettsicht auf ihr gesamtes AWS-Ökosystem von EC2 und EKS bis hin zu CloudFront, DynamoDB und ElastiCache.
Transparenz rund um den Fortschritt sämtlicher Infrastruktur- und Cloud-Migrationen: Diese vermitteln Sie Tech- wie auch Business-Stakeholdern anhand klar definierter Metrics. Dies gilt auch für Hürden, die Sie ggf. antreffen.
Zielführende, relevante und kosteneffiziente Cloud-Investitionen: Dies gewährleisten Sie anhand entsprechender KPIs, die Aufschluss über die Auslastung und darüber geben, ob die Ergebnisse Ihre Business-Ziele erfüllen.
Cloud-Governance und zugehöriges Reporting: So bleibt alles nach klar definierten Vorgaben geregelt.

WICHTIGSTE METRICS: Lückenlose Transparenz rund um die Cloud sorgt für schnellere und besser planbare Migrations-Initiativen, trägt zur Optimierung von Infrastruktur- und Cloud-Kosten bei und erleichtert die Budgetplanung. Hierfür relevant sind etwa folgende Metrics:

Businessbezogen: Effizienz genutzter Ressourcen, Kosten für Kundensupport, Service-Abdeckung, Abwicklungskosten

Technologiebezogen: Time-to-Instrument, Time-to-Provision, Service-Verfügbarkeit, Anzahl der Bereitschaftsdienstrufe, Incident-Aufkommen

Ganz gleich, ob für den Ansturm der Hochsaison oder ganz allgemein: Mit Observability haben Sie den Kompass an der Hand, der Sie zu mehr betrieblicher Effizienz, höherer Stabilität Ihrer Plattformen und gezielter Cloud-Optimierung führt. Denn sie bedeutet klare Sicht auf Ihre Infrastruktur auch aus Perspektive Ihrer Kund:innen. Und damit effektives Engineering hinter den Kulissen der CX.