HAQM Web Services ブログ
Category: Management & Governance
【開催報告】AWS Resilience Day in Tokyo を開催しました!!(2024年10月24日)
近年、ミッションクリティカルなワークロードでの AWS 活用が進むなか、レジリエンシーの確保は業務継続性、およ […]
コンテナでデプロイした Lambda から OpenTelemetry でトレースを X-Ray に送る
はじめに 分散アプリケーションにおいてオブザーバビリティはパフォーマンスボトルネックやエラー率・アプリケーシ […]
【開催報告 & 資料公開】AWS 秋の Observability 祭り 2024
本ブログでは、2024 年 11 月 1 日に実施した「AWS 秋の Observability 祭り ~明日使えるアセット祭り~」のイベントについて内容を簡単にご紹介しつつ、アセット資料を紹介致します。今回のイベントでは、すぐデプロイできるアセットを活用し Observability の高度化をジャンプスタートすることをテーマに様々なアセットをご紹介しました。アセットは生成 AI を活用した Observability での障害分析の効率化 、負荷試験における可視化や異常検知といった Observability で試験の速度と品質の改善、HAQM CloudWatch をさらに高度に活用するためのネットワーク監視、ログ異常検知機能による運用改善と複数のユースケースをカバーしています。
AWS Organizations 全体でマネージドノードの AWS Systems Manager エージェントのステータスを集中監視およびアラート通知する方法
オンプレミスまたは HAQM Elastic Compute Cloud (HAQM EC2) 上の重要なサーバーで実行されている AWS Systems Manager エージェント (SSM エージェント) が、何らかの理由で AWS Systems Manager (SSM) との正常な接続を失った際に、プロアクティブな通知を受けたいと思ったことはありませんか? SSM エージェントのステータスの可視性を高め、ダッシュボードで監視したいと思ったことはありませんか?このブログ記事では、これらの目的を達成するための自動化された仕組みについて説明します。
HAQM Bedrock Agents と HAQM CloudWatch Logs を使用した、生成 AI によるクラウド運用ワークフローの実現
このブログ記事では、AWS のクラウド運用シナリオにおいて、アプリケーションログファイルで観察されたエラーに基づいて問題を分類し、その後解決するために、HAQM Bedrock エージェントと Bedrock の FM を使用した 生成 AI の使用例を紹介します。
我々のソリューションでは、HAQM Bedrock エージェントは基盤モデル (FM) の推論の性能を使用して、CloudWatch Logs に公開されたアプリケーションログについてのエラー解決を要求するユーザー指示を複数のステップに分解します。開発者/アナリストが提供した自然言語の指示を使用してオーケストレーション計画を作成し、その後、関連する API を呼び出し、HAQM Bedrock Knowledge Base にアクセスすることで計画を実行します。これには、大規模言語モデル (LLM) によって生成された応答を補強するために、ベクトルデータストア (HAQM OpenSearch Serverless) から情報を引き出す処理が含まれます。
HAQM CloudWatch Logs Data Protection による機密ログデータの検出と保護
HAQM Web Services (AWS) 上で実行されるお客様のアプリケーションでは、個人を特定できる情報 (PII) や保護された健康情報 (PHI) などの機密データを扱う必要がある場合があります。
その結果、機密ログデータがアプリケーションの可観測性データの一部として意図的または意図せずに記録される可能性があります。包括的なログ記録はアプリケーションのトラブルシューティング、監視、(原因)分析に重要ですが、記録された機密情報はデータセキュリティとコンプライアンスの観点から重大なリスクとなります。このブログでは、HAQM CloudWatch Logs Data Protection を使用してログ内の機密データを検出および保護する方法、データ保護を検証する方法、非準拠の結果を収集および報告する方法を学びます。また、HAQM CloudWatch アラーム、通知、さらなる是正アクションを作成する方法についても学び、コンプライアンス要件を満たすために活用方法をご紹介します。
AWS Resilience Hub の 標準作業手順 (SOP) を自動実行する
AWS Resilience Hub は AWS マネジメントコンソール上でアプリケーションの回復力(レジリエ […]
HAQM Bedrock Insights による CloudWatch アラームへの対応
クラウドで複雑な分散システムを運用する際、問題の原因を迅速に特定し、インシデントを解決することは大変な課題です。トラブルシューティングには、複数の AWS サービスからメトリクス、ログ、トレースをさらけずる必要があり、問題の全体像を把握することが難しくなります。しかし、この Alarm Context Tool (ACT) を使えば、効果的なインシデント解決に必要な時間と労力を削減できます。このブログでは、HAQM CloudWatch アラームに追加のコンテキストを提供する ACT ソリューションを紹介しています。ACT は、AWS Lambda 、HAQM CloudWatch 、AWS X-Ray 、AWS Health 、HAQM Bedrock を活用して、メトリクス、ログ、トレースを統合・分析し、有益な洞察を生成します。ACT を使えば、トラブルシューティングが簡素化され、運用コストを削減でき、AWS 環境の可観測性が向上します。
AWS オブザーバビリティの向上 – HAQM CloudWatch アラームの力を引き出そう
この記事では、CloudWatch アラームを使用した信頼性の高いモニタリングのための重要なヒントと戦略について説明します。アラームの推奨事項の一般的なユースケースを説明し、欠落データのシナリオや警告を早期に発する設定など、具体的なユースケースについて詳しく説明します。
AWS とマルチクラウド: 既存の機能と継続的な機能強化
AWS の大規模なお客様にそれぞれの課題や懸念事項について話すとき、会話のトピックがマルチクラウドに変わること […]