Een plotselinge prestatie crisis net voor de feestdagen: het nachtmerriescenario voor elk digitaal platform. In de week voor kerst 2024 ontving MeasureWorks een dringende oproep van een klant. Een recente deployment had geleid tot ernstige vertragingen in hun API, met als gevolg dat ongeveer 160.000 interacties per dag vastliepen. Gebruikers moesten tot twee minuten wachten op een pagina die normaal gesproken direct zou laden, of kregen helemaal geen reactie. De klant had zelf al weken gezocht naar een oplossing, zonder succes. Het was tijd voor MeasureWorks om in te grijpen.
Vertraging zonder inzicht
Dit platform draait op een complexe architectuur waarin API’s gegevens ophalen en via een iFrame-framework op externe websites tonen. Wanneer dit proces vertraagt, raakt niet alleen hun eigen site, maar ook tientallen andere platforms in de problemen.
Omdat deze klant geen gebruik maakte van een observability-platform, konden wij geen grondige analyse uitvoeren. De uitdaging? De deployment veroorzaakte onvoorspelbare vertragingen, zonder een duidelijke oorzaak. Dit betekende dat we diep in de infrastructuur moesten duiken om het probleem te achterhalen.
Snelle detectie met Kubernetes Monitoring
Gelukkig draaide de applicatie binnen een Kubernetes-cluster, een flexibele, schaalbare omgeving voor containerized applicaties. Met de nieuwste Kubernetes-monitoring technologie van Dynatrace brachten we het cluster in enkele klikken volledig in kaart.
Door gebruik te maken van:
✔ Automatische monitoring van de Kubernetes control plane, deployments en pods.
✔ Full Stack Observability op infrastructuur- en applicatieniveau.
✔ Distributed Tracing om de exacte transactiestroom te volgen.
Binnen enkele uren hadden we een gedetailleerd beeld van het probleemgebied.
Van probleem naar oplossing in 48 uur
De klant diende hun verzoek op dinsdagavond in. Woensdagochtend om 08:30 uur vond de kick-off plaats met hun beheerders en engineers. Het applicatielandschap bestond uit een Kubernetes-cluster met frontend- en backend-workloads en diverse technologieën en databases, waaronder:
- Cloudflare
- HAProxy
- Cassandra databases
- MySQL databases
Onze doelstelling bij MeasureWorks was om het bedrijf en de engineers te coördineren en Dynatrace dezelfde dag nog volledig te onboarden. Dankzij de nieuwe Cloud Native Full Stack-injectie-implementatiestrategie lukte dit probleemloos. Onder de leiding van MeasureWorks hebben de engineers voldaan aan de eisen die wij toen hadden opgesteld.
De Kubernetes cluster was na drie uren volledig in beeld en alle technologieën en databases werden eenvoudig geïntegreerd via extensies, waardoor we aan het eind van de dag klaar waren met de setup.
Op donderdag begonnen we met troubleshooting. Dankzij de Distributed Tracing-technologie van Dynatrace en de expertise van de medewerkers van MeasureWorks kon de oorzaak binnen enkele uren worden gevonden: een over-engineered MySQL-database architectuur! Na een analyse van MeasureWorks binnen de Distributed Tracing-functie werd het duidelijk dat sommige SQL-commits extreem lang duurden. Als oplossing werd donderdagnacht een nieuwe MySQL-database-architectuur uitgerold.
Vrijdagochtend voerde MeasureWorks een uitgebreide analyse uit en concludeerden we dat het probleem volledig was opgelost.
De kracht van Observability
Waar het interne team twee weken zonder succes naar een oplossing zocht, wist MeasureWorks het probleem in twee dagen te identificeren en op te lossen. Dankzij Dynatrace’s observability en onze expertise kon het team van de klant zonder zorgen de feestdagen in.
Bij MeasureWorks geloven we dat monitoring verder gaat dan reactief oplossen: voorkomen is beter dan genezen. Door observability strategisch in te zetten, helpen we bedrijven hun digitale omgeving robuuster en voorspelbaarder te maken. Wil jij meer grip op je applicatie prestaties? Neem contact met ons op!