Limita el número de peticiones que un cliente puede hacer en una ventana de tiempo (por minuto, hora, día o mes). Es la base para diferenciar planes Free, Standard y Premium.
Protege contra ráfagas. No mira el total, mira cuántas peticiones llegan por segundo. Si el límite es 30 por segundo, no permite que lleguen las 30 en el mismo milisegundo.
Guarda la respuesta del backend durante un tiempo configurable. Para datos que no cambian a cada segundo, evita llamadas repetidas al sistema de origen y baja drásticamente la latencia.
Controla cuántas conexiones simultáneas tolera tu backend. Especialmente útil en backends on-premise que tienen un número fijo de procesos disponibles.