Paso 5: Diseñar un limitador de tasa

Publicado el 18/09/2025

Paso 5: Explicación detallada de algoritmos de limitación de tasa con ejemplos y diagramas de casos de uso textuales. En este paso describimos los algoritmos más comunes para controlar el flujo de solicitudes en sistemas de gran escala capaces de manejar miles de millones de peticiones diarias y cientos de millones o miles de millones de usuarios. Incluye ventajas, inconvenientes, ejemplos y cómo se integran en un limitador de tasa distribuido con Redis. También presentamos recomendaciones para una implantación distribuida entre zonas de disponibilidad. Como empresa, Q2BSTUDIO ofrece servicios de desarrollo de software a medida, aplicaciones a medida, soluciones de inteligencia artificial y ciberseguridad que pueden ayudar a implementar estos patrones a producción.

Resumen general Los algoritmos de limitación determinan cómo se permiten o bloquean solicitudes según reglas temporales. La elección afecta la precisión del control, el consumo de memoria, la complejidad y la experiencia del usuario. A continuación se explican cinco algoritmos populares: Token Bucket, Leaking Bucket, Fixed Window Counter, Sliding Window Log y Sliding Window Counter.

Token Bucket Concepto: Un cubo que contiene tokens que representan permisos para solicitudes. Los tokens se reponen a una tasa constante. Cuando llega una solicitud consume un token si hay disponibles, si no hay tokens se limita la solicitud. Características: Permite ráfagas hasta la capacidad del cubo; suaviza el tráfico gracias a la reposición constante. Ventajas: Maneja ráfagas, implementación sencilla y bajo uso de memoria al almacenar solo el contador de tokens y la marca temporal de la última reposición. Inconvenientes: Permite ráfagas que pueden ser explotadas si no se parametriza bien; menos preciso en ventanas cortas. Ejemplo práctico: límite 10 llamadas por segundo con capacidad 20 tokens. A t=0 el cubo está lleno con 20 tokens. Si un usuario envía 15 solicitudes en t=0.5s se permiten las 15 y quedan 5 tokens. A t=1s se añaden 10 tokens hasta un máximo de 20. Si en t=1.5s llegan 20 solicitudes solo 15 se permiten y 5 se limitan. Diagrama de caso de uso textual: Cliente envía petición al servicio limitador. El limitador consulta en Redis la clave user:id:tokens. Si tokens mayor que 0 se decrementa de forma atómica y se permite la solicitud hacia el servidor de aplicaciones. Si tokens igual 0 se responde HTTP 429. Un proceso en segundo plano o lógica on demand calcula la reposición en Redis basándose en la hora última de refill.

Leaking Bucket Concepto: Modela las solicitudes como agua que entra en un cubo que gotea a tasa constante. Si el cubo se desborda las solicitudes se rechazan. Características: Impone un ritmo constante sin permitir ráfagas. Ventajas: Protege backends contra picos repentinos. Inconvenientes: Menos flexible para patrones variables de usuario y requiere gestión de colas, costosa a gran escala. Ejemplo: capacidad 20 y fuga 10 por segundo. Si en t=0.5s llegan 25 solo 20 entran en cola y 5 se rechazan. El sistema procesa 10 en t=1s y así sucesivamente. Diagrama textual: Cliente pide al limitador. El limitador verifica el tamaño de la cola en Redis en user:id:queue. Si cola menor que capacidad hace LPUSH a la lista y devuelve un estado de cola o proceso diferido, si cola llena devuelve HTTP 429. Trabajadores distribuidos extraen elementos a ritmo fijo con RPOP y envían al servidor de aplicaciones.

Fixed Window Counter Concepto: Divide el tiempo en ventanas fijas y mantiene un contador por ventana. Si el contador excede el límite se bloquean las solicitudes hasta la siguiente ventana. Características: Muy simple, contador que se reinicia al final de cada ventana. Inconvenientes: Permite ráfagas en la frontera entre ventanas. Ejemplo: 100 solicitudes por minuto. Si en los últimos segundos de una ventana se consumen 50 y justo al inicio de la siguiente se consumen 50 más se permiten 100 en muy poco tiempo. Diagrama textual: El limitador consulta Redis en user:id:window:start_time con INCR atómico. Si contador menor que límite se incrementa y permite la petición; si no, responde HTTP 429. Se usan TTL o limpieza para expirar ventanas antiguas.

Sliding Window Log Concepto: Mantiene un registro con marcas temporales de cada solicitud dentro de una ventana móvil. Al llegar una nueva solicitud se cuentan las marcas dentro de la ventana y se decide. Características: Muy preciso, evita ráfagas en los límites porque la ventana es continua. Inconvenientes: Uso de memoria alto por almacenar timestamps y operaciones de recorte frecuentes, costoso a escala masiva. Ejemplo: 100 peticiones en 60 segundos. El log guarda cada timestamp; si en la ventana actual ya hay 100 se limita. Diagrama textual: El limitador consulta la lista o sorted set en Redis user:id:log, elimina timestamps anteriores a window, cuenta los restantes y si hay margen añade la marca temporal y permite la petición, si no responde HTTP 429. Adecuado para límites estrictos muy cortos como intentos de login para prevenir fuerza bruta.

Sliding Window Counter Concepto: Compromiso entre fixed window y sliding log. Divide la ventana en subventanas pequeñas y mantiene contadores por subventana. Al consultar se suman los contadores relevantes ponderando la superposición. Características: Más preciso que fixed window y mucho menos costoso en memoria que el log. Ventajas: Buen equilibrio entre precisión y uso de recursos. Inconvenientes: Aproximación que puede tener pequeñas imprecisiones y mayor complejidad de implementación. Ejemplo: límite 100 por 60s con subventanas de 10s. Se almacenan 6 contadores y al evaluar se suman los adecuados. Diagrama textual: El limitador lee claves user:id:subwindow:start_time en Redis, suma contadores de subventanas activas y si el total menor que límite incrementa la subventana actual con INCR atómico y permite la petición, si no devuelve HTTP 429. Usar TTL para expirar subventanas antiguas.

Comparativa para la escala propuesta Considerando miles de millones de solicitudes diarias y aproximadamente 1 000 000 000 de usuarios con retención corta de 10 segundos: Token Bucket ofrece baja memoria y soporte de ráfagas, adecuado para APIs tolerantes a picos cortos. Leaking Bucket proporciona control estricto pero la gestión de colas a escala es costosa. Fixed Window es simple y eficiente en memoria para límites gruesos pero permite ráfagas en los bordes. Sliding Window Log es el más preciso para ventanas cortas pero consume demasiada memoria para 1 000 000 000 de usuarios, por lo que solo es viable para servicios críticos con pocos usuarios activos. Sliding Window Counter equilibra precisión y uso de memoria y es la opción recomendada para la mayoría de APIs a gran escala.

Recomendación de despliegue Redis distribuido entre AZs Para la plataforma descrita recomendamos Sliding Window Counter usando subventanas pequeñas, por ejemplo subventanas de 1s para una ventana total de 10s, almacenando contadores por usuario en Redis con TTL para expiración automática. Distribuya datos mediante sharding para balancear la carga entre nodos Redis y zonas de disponibilidad. Utilice operaciones atómicas INCR y estructuras tipo hashes o sorted sets según preferencia, y despliegue workers distribuidos para tareas de mantenimiento. Para alta disponibilidad configure réplicas y failover entre AZs y optimice la partición de claves por usuario para evitar hotspots. Si necesita un enfoque más flexible para limitar ráfagas puede complementar con un token bucket híbrido local en la capa de aplicación y sincronización periódica con Redis.

Consideraciones prácticas En entornos con límites muy estrictos por ventana corta evalúe el coste de memoria y el número de usuarios activos simultáneos antes de elegir Sliding Window Log. Para límites diarios o mensuales Fixed Window puede ser suficiente y muy eficiente. Para servicios críticos financieros considere Leaking Bucket o colas con procesamiento controlado. La combinación de técnicas a distintos niveles de la arquitectura suele ser la mejor estrategia: por ejemplo un token bucket local para mitigar ráfagas inmediatas y un sliding window counter central en Redis para control global.

Sobre Q2BSTUDIO y cómo podemos ayudar Q2BSTUDIO es una empresa de desarrollo de software que construye software a medida y aplicaciones a medida, con experiencia en inteligencia artificial, ciberseguridad y servicios cloud. Podemos diseñar e implementar la estrategia de limitación de tasa más adecuada para su plataforma, integrar Redis distribuido entre zonas de disponibilidad y aplicar mejores prácticas de seguridad y escalado. Si necesita soluciones de software a medida visite nuestra página de desarrollo de aplicaciones y software multiplataforma para ver ejemplos de proyectos. Para arquitecturas en la nube y despliegues entre AZs consulte nuestros servicios cloud aws y azure donde detallamos soluciones de alta disponibilidad y escalado. Además ofrecemos servicios de ciberseguridad, pentesting y arquitecturas de inteligencia artificial para empresas, incluyendo agentes IA y soluciones de inteligencia de negocio y power bi para mejorar la observabilidad y la toma de decisiones.

Resumen final Cada algoritmo tiene fortalezas y debilidades: Token Bucket y Leaking Bucket gestionan el ritmo y las ráfagas; Fixed Window es simple para límites gruesos; Sliding Window Log ofrece precisión a coste alto; Sliding Window Counter es la opción equilibrada para sistemas a gran escala. Para el escenario indicado recomendamos Sliding Window Counter implementado sobre Redis distribuido, con subventanas adecuadas, TTL y operaciones atómicas, y complementado cuando proceda por controles locales y políticas de seguridad gestionadas por equipos especializados como los de Q2BSTUDIO. Si desea que le ayudemos a seleccionar o implementar el algoritmo más adecuado para su sistema contacte con nosotros para una consultoría personalizada.

POLITICA DE COOKIES

Paso 5: Diseñar un limitador de tasa - Algoritmo y técnica

Patrones de limitación de tasa para sistemas a gran escala e implementación distribuida con Redis

Dando vida a tus ideas desde 2008