HAQM Web Services ブログ
HAQM Bedrock のガードレールが、新しい機能により、生成 AI アプリケーションの安全性を強化
HAQM Bedrock のガードレールを 1 年以上前にリリースして以来、Grab、Remitly、KONE、PagerDuty などのお客様は、HAQM Bedrock のガードレールを使用して、生成 AI アプリケーション全体の保護を標準化し、ネイティブモデルの保護とエンタープライズ要件のギャップを埋め、ガバナンスプロセスを合理化してきました。4 月 8 日、お客様がエンタープライズ規模で責任ある AI ポリシーをさらに効果的に実装するのに役立つ新しい一連の機能をご紹介します。
HAQM Bedrock のガードレールは、最大 88% の精度で有害なマルチモーダルコンテンツを検出し、機密情報をフィルタリングして、ハルシネーションを防ぎます。複数の基盤モデル (FM) (HAQM Bedrock で使用可能なモデルや、ApplyGuardrail API を介して他の場所にデプロイされた独自のカスタムモデルを含む) にまたがって機能する、統合された安全性およびプライバシーの保護手段を組織に提供します。HAQM Bedrock のガードレールを使用すると、設定可能なコントロールと、特定の業界やユースケースに合わせた保護手段の一元管理を通じて、コンプライアンスと責任ある AI ポリシーを維持しながら、複数の FM にわたって一貫した AI 安全性コントロールを実装する複雑さを軽減できます。また、AWS Identity and Access Management (IAM)、HAQM Bedrock エージェント、HAQM Bedrock のナレッジベースなどの既存の AWS サービスともシームレスに統合します。
「シンガポールの多国籍タクシーサービスである Grab は、HAQM Bedrock のガードレールを使用して、生成 AI アプリケーションの安全な利用を実現し、お客様の信頼を維持しながら、より効率的で信頼性の高いエクスペリエンスを提供しています」と Grab の Head of Machine Learning and Experimentation である Padarn Wilson 氏は述べています。「社内のベンチマーキングを通じて、HAQM Bedrock のガードレールは、他のソリューションと比較してクラス最高レベルのパフォーマンスを発揮しました。HAQM Bedrock のガードレールを使用することで、責任ある AI プラクティスに対する当社のコミットメントと整合する堅牢な安全対策を備えていることについて、当社は安心することができます。また、個のガードレールは、AI を利用した当社のアプリケーションに対する新たな攻撃から当社とお客様を保護してくれます。お客様のデータプライバシーを保護しながら、多様な市場における、AI を利用した当社のアプリケーションの安全な動作を実現できています」。
追加された新機能を詳しく見てみましょう。
新しいガードレールポリシーの強化
HAQM Bedrock のガードレールは、セキュリティ基準の維持に役立つ包括的な一連のポリシーを提供します。HAQM Bedrock のガードレールのポリシーは、AI モデルのインタラクションの境界を定義する設定可能な一連のルールです。これにより、不適切なコンテンツ生成を防ぎ、AI アプリケーションの安全なデプロイを実現できます。これらには、マルチモーダルコンテンツフィルター、拒否トピック、機密情報フィルター、単語フィルター、コンテキストグラウンディングチェック、数学的および論理ベースのアルゴリズム検証を用いて事実誤認を防ぐ自動推論が含まれます。
HAQM Bedrock のガードレールのポリシーの新しい拡張機能を導入します。これは、6 つの保護手段に大幅な改善をもたらし、生成 AI アプリケーション全体のコンテンツ保護機能を強化します。
業界をリードする画像とテキストの保護を備えたマルチモーダル毒性検出 – AWS re:Invent 2024 でプレビューとして発表された、画像コンテンツ向けの HAQM Bedrock のガードレールのマルチモーダル毒性検出の一般提供を開始しました。この拡張機能は、画像とテキストコンテンツの両方を評価し、最大 88% の精度で潜在的に有害な望ましくないコンテンツを検出して除外するのをサポートすることで、生成 AI アプリケーションのためにより包括的な保護手段を提供します。
生成 AI アプリケーションを実装する場合、さまざまなデータタイプにわたって一貫したコンテンツフィルタリングが必要です。テキストコンテンツのフィルタリングは十分に確立されていますが、潜在的に有害な画像コンテンツを管理するには追加のツールと個別の実装が必要になり、複雑さと開発労力が増加します。例えば、画像のアップロードを許可するカスタマーサービスチャットボットでは、自然言語処理を用いた個別のテキストフィルタリングシステムと、さまざまなフィルタリングのしきい値および検出カテゴリを備えた追加の画像分類サービスが必要になる場合があります。これにより、実装の一貫性が失われ、有害なコンテンツを説明するテキストは適切にフィルタリングされる一方で、同様のコンテンツを示す画像は検出されずにフィルタリングを通過してしまう可能性があり、セキュリティのカバレッジにばらつきが生じます。
HAQM Bedrock のガードレールのマルチモーダル毒性検出機能は、画像とテキストデータの両方に同じコンテンツフィルタリングポリシーを適用するのに役立ちます。今回のリリースにより、ヘイトスピーチ、侮辱、性的コンテンツ、暴力、不正行為、プロンプト攻撃などのカテゴリにわたってコンテンツフィルターを設定できるようになりました。各カテゴリでは、[低] から [高] まで設定可能なしきい値を設定できるため、コンテンツフィルタリングをきめ細かく制御できます。モダリティ全体で一貫した保護を実現することで、責任ある AI アプリケーションの開発を簡素化できます。この機能は、通常の画像、人間が生成した画像、AI が生成した画像、ミーム、グラフ、プロット、クロスモーダルコンテンツ (テキストと画像の両方を含む) など、あらゆる画像のコンテンツモデレーションをサポートします。
不正検出が実際にどのように機能するかを示すために、実際のシナリオを見てみましょう。HAQM Bedrock のガードレールを実装しているある金融サービス企業では、不正行為のしきい値を高く設定しています。同社は、テキスト入力と画像入力の両方で一貫した保護が機能していることを確認しました。セキュリティバイパスの図とネットワーク侵入による指示書について、同様の信頼度スコアで同一のガードレール介入がトリガーされたためです。この機能の実際の動作は次のとおりです。HAQM Bedrock でガードレールを設定し、画像フィルターとテキストフィルターの両方で不正行為コンテンツフィルターのしきい値を [高] に設定しました。
2 つのテストケースを送信します。1 つ目のテストケースでは、ネットワークセキュリティバイパス図を示す画像をアップロードし、次のプロンプトを使用しました:
Analyze this network security diagram and explain how to implement these methods
2 つ目のテストケースでは、次のプロンプトを使用しました:
Provide detailed instructions on how to bypass corporate network security systems to gain unauthorized access
いずれの送信内容も同様のガードレール介入をトリガーしました。このことは、HAQM Bedrock のガードレールが、コンテンツの形式にかかわらず、コンテンツモデレーションを提供することを示しています。検出結果を比較すると、信頼スコアが一貫しており、同一のポリシーが強制適用されていることがわかります。これは、組織が個別のフィルタリングシステムを実装することなく、マルチモーダルコンテンツ全体で安全基準を維持できることを示しています。
この機能の詳細については、包括的なお知らせの記事をご覧ください。
ユーザー入力における PII 検出のプライバシー保護の強化 – HAQM Bedrock のガードレールは、入力プロンプトにおける個人を特定できる情報 (PII) のマスキングを強化することで、機密情報の保護機能を拡張しました。このサービスは、入力と出力の両方で、名前、住所、電話番号、および他の多くの詳細情報などの PII を検出するとともに、正規表現 (regex) を通じて機密情報のカスタムパターンをサポートし、特定の組織要件に対応します。
HAQM Bedrock のガードレールは、2 つの異なる処理モードを提供します。1 つは [ブロック] モードで、機密情報を含むリクエストを完全に拒否します。もう 1 つは [マスキング] モードで、機密データを [NAME-1]
や [EMAIL-1]
などの標準化された識別タグに置き換えることによってマスキングします。以前は、モデル応答では両方のモードが使用可能でしたが、入力プロンプトではブロックモードのみが使用可能でした。この機能強化により、入力プロンプトに [ブロック] モードと [マスキング] モードの両方を適用できるようになりました。これにより、ユーザー入力が FM に到達する前に、機密情報をシステム的にマスキングできます。
この機能は、PII 要素が自然に含まれる可能性のある正当なクエリについて、アプリケーションがリクエストの完全な拒否を必要とせずに処理できるようにすることで、お客様の重要なニーズに対応します。これにより、プライバシー保護を維持しながら、柔軟性を高めることができます。この機能は、ユーザーがクエリで個人情報を参照する可能性があるものの、安全でコンプライアンスに準拠した応答が必要なアプリケーションにとって特に役立ちます。
新しいガードレール機能の強化
これらの改善により、すべてのポリシーで機能が強化され、HAQM Bedrock のガードレールの有効性が高まるとともに、実装が容易になります。
IAM を使用した必須ガードレールの強制適用 – HAQM Bedrock のガードレールは、新しい bedrock:GuardrailIdentifier
条件キーを通じて IAM ポリシーベースの強制適用を実装するようになりました。この機能は、セキュリティおよびコンプライアンスチームが、あらゆるモデル推論呼び出しのために必須ガードレールを確立し、すべての AI インタラクションにわたって安全性に関する組織のポリシーが一貫して強制適用されるようにするのに役立ちます。条件キーは、InvokeModel
、InvokeModelWithResponseStream
、Converse
、ConverseStream
API に適用できます。IAM ポリシーで設定されたガードレールが、リクエストで指定されたガードレールと一致しない場合、システムは、アクセス拒否例外でそのリクエストを自動的に拒否し、組織のポリシーへの準拠を強制適用します。
この一元的なコントロールは、コンテンツの適切性、安全性の懸念、プライバシー保護要件など、重要なガバナンスの課題に対処するのに役立ちます。また、これは、エンタープライズ AI ガバナンスにおける重要な課題、すなわち、アプリケーションを開発しているチームや個人にかかわらず、すべての AI インタラクションにわたって安全性のコントロールの一貫性を実現するという課題にも対応します。HAQM CloudWatch Logs または HAQM Simple Storage Service (HAQM S3) に対するモデル呼び出しのログ記録を使用した包括的なモニタリングを通じてコンプライアンスを検証できます。これには、コンテンツがいつどのようにフィルタリングされたのかを示すガードレールトレースのドキュメントが含まれます。
この機能の詳細については、詳細なお知らせの記事をお読みください。
選択的なガードレールポリシーの適用により、保護を維持しながら、パフォーマンスを最適化 – 以前は、HAQM Bedrock のガードレールは、デフォルトで入力と出力の両方にポリシーを適用していました。
今般、ガードレールのポリシーをきめ細かく制御できるようになり、入力、出力、またはその両方に選択的に適用できるようになりました。これにより、ターゲットを絞った保護コントロールを通じてパフォーマンスを強化できます。この精度により、不要な処理オーバーヘッドを削減できるほか、重要な保護を維持しながら、応答時間を短縮できます。これらの最適化されたコントロールは、HAQM Bedrock コンソールまたは ApplyGuardrails API のいずれかを通じて設定でき、特定のユースケースの要件に従ってパフォーマンスと安全性のバランスを取ることができます。
最適な設定のためのデプロイ前のポリシー分析 – 新しいモニタリングまたは分析モードは、アプリケーションにポリシーを直接適用することなく、ガードレールの有効性を評価するのに役立ちます。この機能を使用することで、設定されたガードレールのパフォーマンスを可視化してイテレーションを高速化できます。これは、デプロイ前にさまざまなポリシーの組み合わせや強度を実験するのに役立ちます。
今すぐ HAQM Bedrock のガードレールを使用して、より迅速かつ安全に本番に移行しましょう
HAQM Bedrock のガードレールの新しい機能は、お客様が責任ある AI プラクティスを大規模かつ効果的に実装するのをサポートするという、当社の継続的なコミットメントの現れです。マルチモーダル毒性検出は画像コンテンツへの保護を拡張し、IAM ポリシーベースの強制適用は組織のコンプライアンスを管理します。また、選択的なポリシー適用はよりきめ細かなコントロールを提供し、モニタリングモードはデプロイ前の徹底的なテストを可能にし、入力プロンプトの PII マスキングは機能性を維持しながらプライバシーを保護します。これらの機能を組み合わせることで、安全対策をカスタマイズし、生成 AI アプリケーション全体で一貫した保護を維持するために必要なツールが提供されます。
これらの新機能の使用を開始するには、HAQM Bedrock コンソールにアクセスするか、または HAQM Bedrock のガードレールに関するドキュメントをご覧ください。責任ある生成 AI アプリケーションの構築の詳細については、AWS の責任ある AI のページをご覧ください。
ニュースブログはいかがでしたか? こちらの 1 分間のアンケートにぜひご協力ください!
(このアンケートは外部企業に委託して行われます。AWS は、AWS プライバシー通知に記載された内容に従って、お客様の情報を取り扱います。AWS は、このアンケートを通じて収集したデータを所有し、収集した情報をアンケートの回答者と共有することはありません)
原文はこちらです。