Um dos clientes mais críticos de nossos Premium Partners do ATS Group é um grande MSP (Provedor de Serviços Gerenciados) que atua como uma plataforma de serviços e administração para seus próprios clientes, fornecendo hardware, software, engenheiros, equipe de suporte, métricas e relatórios.
O desafio
O MSP precisava de uma solução de monitoramento de plataforma estável e de alto desempenho que cobrisse todos os serviços oferecidos. Eles não tinham capacidade nem orçamento para manter várias ferramentas de monitoramento — uma solução única e flexível que pudesse monitorar todos os serviços era fundamental, assim como a capacidade de reagir a anomalias antes que se tornassem problemas sérios.
Após um teste inicial com outra ferramenta de monitoramento, que se destacou negativamente pelo serviço ruim, falta de integrações, inexistência de comunidade e praticamente nenhuma documentação, o MSP decidiu olhar mais de perto para o Zabbix, em grande parte graças ao foco da solução em ações preventivas e automação.
A solução
Por conta de seu foco em monitoramento baseado em desempenho, o cliente optou por uma arquitetura “hot-cold” e por uma integração com o Ansible EDA, sigla para Event-Driven Ansible. Essa combinação se mostrou um verdadeiro “multiplicador de forças”, já que usar Zabbix, Ansible e EDA juntos permitiu ao MSP monitorar seus sistemas, automatizar tarefas com base em eventos em tempo real e oferecer respostas imediatas a problemas sem intervenção manual.
A integração foi desenhada para classificar os incidentes conforme a necessidade ou não de ação humana. Se surgisse um problema que exigisse intervenção, alertas podiam ser enviados ao ServiceNow por múltiplos canais. Se a intervenção humana não fosse necessária, o evento era redirecionado ao Event-Driven Ansible, que executava a automação em todos os hosts monitorados.
Por exemplo, com a solução conjunta entre Zabbix e Ansible, o acúmulo de arquivos de log em um sistema de gestão interna durante a madrugada já não representa mais um problema urgente. Se houver múltiplos gigabytes disponíveis no grupo de volumes, o Zabbix pode sinalizar o problema ao Ansible, que então aumenta o sistema de arquivos em 25% e envia uma mensagem informando aos engenheiros, pela manhã, que a ação já foi tomada.
Os resultados
Com praticamente nenhum custo de software e uma integração automatizada capaz de identificar e corrigir problemas de forma autônoma, o MSP conseguiu alcançar rapidamente uma relação custo-benefício muito superior à que imaginava ser possível.
Também houve um aumento notável na satisfação dos colaboradores – graças à automação, os engenheiros não precisam mais estar de plantão o tempo todo para resolver problemas simples, enquanto os executivos de alto nível viram a produtividade crescer significativamente devido à capacidade da solução conjunta de identificar potenciais falhas antes que se tornem problemas reais.
Conclusão
Na Zabbix, trabalhamos arduamente para permanecer na vanguarda da automação. Isso significa melhorar continuamente nosso próprio produto e também acompanhar de perto novas tecnologias como o Event-Driven Ansible, com o objetivo de integrá-las cada vez melhor. Para saber mais sobre o que o Zabbix pode fazer por MSPs, visite nosso site.