MTTR (Mean Time To Recovery) mierzy, jak szybko przywracasz usługę po incydencie. Poprawa to lepsza detekcja, runbooki, szybkie rollbacki i wyćwiczony incident response.
Rozbij MTTR na fazy i optymalizuj każdą z nich:
Rozkład MTTR:
MTTR = time_to_detect + time_to_triage + time_to_mitigate