

Duendecillo hoy amplió su conjunto de herramientas de confiabilidad con Failure Flags, una solución sin código diseñada para permitir a los equipos probar y medir la resiliencia de las aplicaciones en entornos híbridos, de contenedores y sin servidor sin modificar el código fuente de la aplicación.
En esencia, Failure Flags dirige el tráfico de red de aplicaciones a través de un contenedor dedicado, lo que permite a los ingenieros inyectar fallas controladas, como picos de latencia, paquetes descartados y fallas de dependencia específicas que imitan interrupciones y degradación del mundo real. Debido a que el proxy se encuentra entre la aplicación y sus dependencias, los equipos no necesitan un SDK ni cambios de código para ejecutar experimentos, lo que hace que las implementaciones sean más rápidas y aplicables a entornos que incluyen AWS Lambda, Azure Functions, Google Cloud Functions y Kubernetes.
Kolton Andrus, fundador de Gremlin, dice que el enfoque es deliberadamente de baja fricción: «Failure Flags permitirá a los ingenieros simplemente colocar un proxy y probar la confiabilidad de sus aplicaciones». Gremlin combina indicadores de falla con controles de estado que monitorean continuamente la red base y las métricas de las aplicaciones y detienen automáticamente los experimentos si surgen anomalías.
Según la compañía, Failure Flags permite realizar pruebas de confiabilidad específicas en todo el ciclo de vida, desde simular interrupciones en la región de la nube hasta validar cómo se comporta una sola llamada de función en caso de emergencia. Esa granularidad ayuda a los equipos a descubrir patrones de dependencia frágiles y riesgos superficiales que podrían no aparecer en pruebas estáticas o entornos de preparación limitados.
Failure Flags también amplía la puntuación de confiabilidad de Gremlin. Al activar estos experimentos, los clientes pasan de una puntuación centrada en la infraestructura a una medida de confiabilidad del entorno más completa que incluye el comportamiento de la capa de aplicación. Esta evolución ayuda a las organizaciones a identificar y rastrear el riesgo de confiabilidad en las capas de infraestructura y aplicación, alineando las métricas operativas con el impacto en el usuario en el mundo real.
Vale la pena señalar que los indicadores de falla se colocan como un complemento de los indicadores de funciones, no como un reemplazo. Muchas empresas ya utilizan indicadores de funciones para controlar la implementación de funciones y la exposición de la audiencia; Las banderas de falla añaden una capacidad diferente pero sinérgica. Mientras que los indicadores de funciones responden «¿quién obtiene esta función y cuándo?», los indicadores de falla responden «¿cómo se comportará esta función en condiciones adversas?» Utilizados en conjunto, los equipos pueden implementar funciones de forma incremental con indicadores de funciones y validar simultáneamente la solidez mediante indicadores de falla, lo que mejora la confianza antes de exponer los cambios a segmentos de usuarios más grandes.
Las empresas con pilas complejas y distribuidas son las que más se beneficiarán: los equipos de productos pueden validar la resiliencia de las nuevas capacidades durante implementaciones progresivas, los SRE pueden buscar proactivamente dependencias frágiles y los gerentes de ingeniería obtienen información mensurable sobre cómo los cambios de código afectan todo el entorno de producción. El enfoque de Gremlin tiene como objetivo hacer que las pruebas de fallas formen parte de las prácticas rutinarias de desarrollo e implementación.
A medida que las organizaciones introducen más cargas de trabajo en topologías híbridas y sin servidor, las herramientas que inyectan modos de falla realistas sin tocar el código de la aplicación pueden convertirse en una parte estándar del manual de confiabilidad. Failure Flags ofrece un camino pragmático hacia ese resultado al combinar implementación sin código, controles de seguridad automatizados y puntuación de confiabilidad integrada para ayudar a los equipos a evaluar y mejorar sus sistemas continuamente.
