Nuestros Socios Premium del Grupo ATS trabajan en colaboración con una importante agencia federal del gobierno de Estados Unidos. Son los principales responsables de proporcionar servicios de almacenamiento y computación como servicio (CaaS), garantizando así el funcionamiento continuo de la agencia.
El desafío
El objetivo principal de la agencia era simplificar la monitorización de la capacidad y el rendimiento sin costes adicionales. Además, existían requisitos regulatorios y de supervisión de objetivos de nivel de servicio (SLO) extremadamente estrictos que debían cumplirse, especialmente en lo que respecta a la capacidad y el rendimiento.
No existía ningún software comercial en el mercado que satisficiera todas estas necesidades de forma nativa. Aun así, era crucial contar con una solución lo suficientemente potente y flexible como para monitorizar prácticamente cualquier recurso.
La solución
Debido a que la agencia tiene múltiples centros de datos de diferentes tamaños, adoptó una estructura distribuida con servidores proxy, informes SLA detallados, integración con ServiceNow, varias integraciones internas y una solución de monitoreo con Zabbix, incluyendo alertas predictivas.

A pesar de utilizar diversos programas, las operaciones se basan principalmente en almacenamiento, VMware y Kubernetes. Además, cuentan con varias oficinas satélite y centros de datos, lo que permite que otro centro de datos se conecte rápidamente si falla, minimizando así el tiempo de inactividad.
La infraestructura monitoriza más de 30 métricas y más de un billón de puntos de datos en 10 tecnologías principales, muchas de las cuales son obligatorias por normativa. Se requirieron soluciones específicas para miles de métricas detalladas, como núcleos y frecuencia de CPU, métricas de uso de procesador a núcleo y tasas de virtualización entre hosts y máquinas virtuales.
El entorno OpenShift basado en Kubernetes también requería monitorización según especificaciones rigurosas. La implementación se realizó mediante Helm Chart, con componentes de Zabbix instalados como recursos de Kubernetes, monitorizando tanto las aplicaciones como los recursos a nivel de nodo y enviando datos agregados al servidor Zabbix.

Las métricas se recopilan mediante la API de Kubernetes y kube-state-metrics. La solución también utiliza métricas exportadas por Prometheus o llamadas directas a endpoints HTTP. Para la configuración, se crearon proxies y hosts en Zabbix para representar nodos y clústeres de Kubernetes, mientras que las plantillas y macros se configuraron para apuntar a la API de Kubernetes y a los endpoints de kube-state-metrics.
Los resultados
Gracias a Zabbix, la agencia federal ahora cuenta con una solución que centraliza la monitorización de Kubernetes junto con otros recursos de TI, admite métricas específicas de cada aplicación sin depender únicamente de los endpoints de Prometheus y ofrece flexibilidad de personalización y escalabilidad.
Además, las capacidades de alerta predictiva de Zabbix identifican anomalías en los datos operativos y emiten alertas tempranas sobre cualquier situación que pueda afectar a las aplicaciones o servicios. Esto permite a la agencia cumplir con los SLA, optimizar la experiencia del usuario y aumentar la productividad.
Conclusión
La flexibilidad y la facilidad de personalización de Zabbix lo hacen ideal para organizaciones que necesitan una fuente de información única y confiable, incluso en los entornos regulatorios más exigentes.
Para obtener más información sobre lo que Zabbix puede ofrecer al sector público, hable con nuestro equipo.