사전 예방적 모니터링, 문제 해결, 데이터 기반 인사이트를 통해 AWS 리소스 성능 및 가용성을 최적화하여 원활하고 효율적이며 안전한 클라우드 운영을 지원합니다.
데이터를 표면화하여 문제의 근본 원인을 신속하게 진단함으로써 평균 해결 시간(MTTR)을 단축할 수 있습니다.
컨테이너와 서버리스 서비스 전반의 엔드 투 엔드 관찰성 및 분석을 통합하여 서비스 전반에서 번거로운 태깅과 이벤트 상관 관계를 제거할 수 있습니다.
컨테이너와 서버리스 워크로드를 모니터링하고 문제를 해결하여 복원력과 효율성을 향상할 수 있습니다. 예를 들어 CloudWatch의 AI 및 ML 기반 기능을 활용하여 자연어를 사용해 로그와 지표를 쿼리하고, 패턴을 분석하고, 이상 징후를 감지하며, CloudWatch 로그에서 민감한 데이터를 자동으로 마스킹할 수 있습니다.
Amazon Bedrock과 Amazon CloudWatch의 성능을 활용하여 생성형 AI 애플리케이션의 성능을 효과적으로 모니터링하고 최적화할 수 있습니다. CloudWatch Container Insights를 사용하면 Amazon EKS 클러스터의 NVIDIA GPU에 대한 주요 상태 지표를 자동으로 검색 및 모니터링하여 리소스 사용률, 가용성, 지연 시간에 대한 가시성을 제공할 수 있습니다. CPU, 메모리, GPU, 네트워크 지표를 분석하여 효율성을 최적화하고 잠재적인 병목 현상 또는 이상 징후를 조기에 식별합니다.
CloudWatch 대시보드 및 경보를 사용해 실행 기간, 오류, 스로틀과 같은 주요 운영 지표를 모니터링하여 서버리스 애플리케이션의 성능에 대한 심층적인 인사이트를 얻을 수 있습니다. 또한 CloudWatch Logs Insights를 사용하면 로그 데이터 및 분산 추적을 분석하여 잠재적 병목 현상을 식별할 수 있습니다. 이러한 CloudWatch 기능을 활용하면 서버리스 아키텍처를 최적화하여 비용을 줄이고 효율성을 높일 수 있습니다.
CloudWatch Container Insights는 클러스터, 노드, 서비스, 컨테이너 수준 데이터를 비롯하여 AWS Fargate, Amazon ECS, Amazon EKS에 대한 포괄적인 상태 및 성능 지표를 제공합니다. 또한 EKS 컨트롤 플레인과 KubeState 지표를 통합하여 문제의 근본 원인을 분석하고 식별할 수 있습니다.