Przy wielu instancjach licznik w pamięci limituje tylko jedną instancję, więc sumaryczny ruch może przekroczyć limit. Zwykle potrzebujesz współdzielonego storage (np. Redis) albo limitów na gatewayu. Trudne elementy: poprawność przy współbieżności, okna czasowe, drift zegara i unikanie “hot keys”.