Publicado: Nov 2, 2021

Agora, o HAQM DevOps Guru oferece suporte a métricas adicionais em nível de nó e pods para clusters gerenciados pelo HAQM Elastic Kubernetes Service (EKS).

O HAQM DevOps Guru é um serviço baseado em Machine Learning (ML) que torna mais fácil melhorar a performance operacional e a disponibilidade de uma aplicação. Quando o HAQM DevOps Guru detecta comportamento anômalo nessas métricas, ele cria um insight que contém recomendações e listas de métricas e eventos relacionados ao problema para ajudar você a diagnosticar e resolver o comportamento anômalo.

Essas métricas em nível de nó ajudam a identificar nós específicos que podem ter alta utilização de memória, CPU ou sistema de arquivos, em vez de depender de agregados em nível de cluster. As métricas de nível de pod, que incluem pod_cpu_utilization_over_pod_limit e pod_memory_utilization_over_pod_limit, ajudarão a identificar quais pods estão ultrapassando limites flexíveis e, portanto, correm o risco de atingir restrições de recursos fixas e de gerar erros devido ao esgotamento de recursos. O HAQM DevOps Guru agora também rastreia reinicializações de contêineres e notifica você sobre problemas com a extração de imagens ou problemas com a inicialização de aplicações. Também continuaremos a expandir o suporte do HAQM DevOps Guru para contêineres.

Também estamos apresentando uma nova visualização no console que mostrará insights do HAQM EKS agrupados por métrica no nível do cluster no console do HAQM DevOps Guru. Essa visualização fornece mais visibilidade de onde está um problema potencial dentro do cluster do EKS. Por exemplo, se um nó estiver com problemas de conectividade de rede ou estiver enfrentando pressão de disco, você verá que as anomalias do nó e do namespace aparecem agrupadas nessa métrica por cluster, o que ajudará a identificar o nó ou namespace específico com o problema.

Para usar esses novos recursos, você precisará habilitar o Container Insights no HAQM EKS.

Você pode começar a usar o HAQM DevOps Guru selecionando a cobertura nas pilhas do CloudFormation ou na sua conta da AWS. Para saber mais, visite a página de produtos do DevOps Guru e as páginas de documentação ou publique uma pergunta no fórum do HAQM DevOps Guru