HAQM Web Services ブログ
Category: Containers
HAQM EKS Hybrid Nodes を活用し、様々な環境にわたって生成 AI 推論を実行する
HAQM Elastic Kubernetes Service (HAQM EKS) Hybrid Nodes は、クラウドとオンプレミスにわたって生成 AI 推論ワークロードを実行する方法を変革します。EKS クラスターをオンプレミスのインフラストラクチャに拡張することで、管理の一貫性と運用の複雑さの軽減を実現しながら AI アプリケーションをデプロイできます。HAQM EKS はマネージドな Kubernetes コントロールプレーンを提供し、EKS Hybrid Nodes を使用すると、オンプレミスのインフラストラクチャをワーカーノードとして HAQM EKS コントロールプレーンに参加させることができます。これにより、オンプレミスで Kubernetes コントロールプレーンを管理する必要がなくなります。EKS Hybrid Nodes を使用すると、単一の EKS クラスター内でクラウドとオンプレミスの両方のキャパシティを活用できます。
AWSLogs コンテナログドライバーのノンブロッキングモードによるログ損失の防止
可観測性の向上とトラブルシューティングのために、コンテナログをコンピューティングプラットフォームから、ログ集約サーバーに転送することをお勧めします。実際には、ログサーバーが到達不能になったり、ログを受け入れられなくなる場合があります。ログサーバーの障害に対するアーキテクチャ設計には、トレードオフがあります。サービス所有者は、次の点を検討する必要があります。
アプリケーションは、トラフィックへの応答 (または作業の実行) を停止し、ログ集約サーバーが復旧するのを待つべきでしょうか? (正確な監査ログがサービスの可用性よりも優先されますか?)
アプリケーションは、ログサーバーがバッファを使い切る前に復旧することを期待してログをバッファリングしながらトラフィックに対応し続けるべきでしょうか? ログ送信先が利用できないレアケースにおいてログが失われるリスクを受け入れるべきでしょうか?
コンテナのログドライバーでは、このトレードオフは上記 1 の考慮事項に対して「ブロッキング」の設定パラメータ、2 の考慮事項に対して「ノンブロッキング」の設定パラメータで実装されています。AWS ブログの「Choosing container logging options to avoid backpressure」では、Rob Charlton がこのトレードオフを探求し、AWSLogs コンテナログドライバーのデフォルトの「ブロッキング」モードでアプリケーションがどのように動作するかをテストする方法を説明しています。
この記事では、「ノンブロッキング」 について詳しく説明し、AWSLogs ログドライバーを使用したログ損失の試験結果を示します。
HAQM EKS が HAQM Application Recovery Controller のサポートを開始
HAQM Elastic Kubernetes Service (HAQM EKS) が HAQM Application Recovery Controller (ARC) のサポートを開始しました。ARC は AWS リージョンまたはアベイラビリティゾーン (AZ) の障害に対する準備と復旧を可能にする AWS サービスです。ARC には、ゾーンシフトとゾーンオートシフトを含むマルチ AZ リカバリと、ルーティングコントロールと準備状況チェックを含むマルチリージョンリカバリの 2 つの機能があります。今回のリリースにより、以前は Application Load Balancer (ALB) と Network Load Balancer (NLB) でのみ利用可能だったゾーンシフトとゾーンオートシフトが HAQM EKS をサポートしました。
HAQM EKS Auto Mode を始めよう
Kubernetes クラスターにおけるコンピューティング、ストレージ、ネットワーキングを効率的に管理する新機能、HAQM Elastic Kubernetes Service (HAQM EKS) Auto Mode の一般提供を発表しました。この機能により、クラスターを迅速に構築し、パフォーマンスを向上させ、管理の手間を減らすことができます。クラスター管理を AWS に任せることで、アプリケーションの構築に集中してイノベーションの推進に注力いただけます。この記事では、EKS Auto Mode の高レベルアーキテクチャを紹介し、EKS Auto Mode を使用して高可用性かつ自動スケーリング機能を備えたサンプルアプリケーションをデプロイする手順を紹介します。
Istio と ARC ゾーンシフトによる HAQM EKS におけるモニタリングとAZ障害からのリカバリ自動化
マイクロサービスアーキテクチャをクラウドで実行することは、すぐに複雑な運用になる可能性があります。個々のワークロードにおける複数のインスタンスのような増え続ける変動要素を、インフラストラクチャの依存関係と合わせて考慮する必要があります。HAQM EKS 環境では、1 つのワーカーノード、一部のワーカーノード、または AZ 全体に問題が発生することがあります。AZ の障害が発生した場合は、回復力と復旧戦略の一環として HAQM Application Recovery Controller (ARC) のゾーンシフトを使用できます。ARC ゾーンシフトを使用すると、クラスター内のネットワークトラフィックを、影響を受けた AZ から一時的にリダイレクトできます。この投稿では、ゾーンシフトを管理するためのシグナルとして Istio のメトリクスを利用し、AZ における異常または劣化が発生した際に、アプリケーションの迅速な復旧を監視および自動化する方法に焦点を当てています。
オブザーバビリティが強化された Container Insights が HAQM ECS で利用可能に
2023 年、 HAQM CloudWatch Container Insights におけるオブザーバビ […]
予測スケーリングを用いて HAQM ECS のコンピューティングリソースを最適化する
HAQM ECS は、新しいスケーリングポリシーである「予測スケーリング」をリリースしました。このポリシーでは、高度な機械学習アルゴリズムを用いて需要の急増を予測し、前もってタスク数を増加させることで、アプリケーションの可用性と応答性を向上させます。また、過剰なプロビジョニングを削減することで、コスト削減を実現します。この記事では、予測スケーリングの概要を説明し、この機能が役立つ場面や設定手順について解説します。
HAQM VPC Lattice に組み込まれた HAQM ECS サポートを使用して、コンテナアプリケーションネットワーキングを合理化
HAQM VPC Lattice は、リリース以来、複雑なネットワーキングタスクを効率化してきました。その […]
HAQM ECS におけるデプロイメントの可視性の向上
HAQM ECS は、強化された可視性とトレーサビリティの機能を提供開始しました。新しく導入されたサービスデプロイメントとサービスリビジョンを活用することで、HAQM ECS におけるアプリケーションデプロイメントについて、より深い洞察を得ることができます。この記事では、信頼性と透明性の高いソフトウェアリリースライフサイクルを実現する上で、これらの機能がどのように役立つのか、ハンズオン形式で説明します。
【開催報告】コンテナ/サーバーレスによるモダン・プロジェクト実践 – 事例セミナー
2024年11月1日に、「コンテナ/サーバーレスによるモダン・プロジェクト実践」と題して 3社にご講演いただき […]