HAQM Bedrock のモデル評価が AWS GovCloud (米国西部) リージョンで利用可能に

投稿日: 2024年9月30日

HAQM Bedrock のモデル評価では、ユースケースに最適な基盤モデルを評価、比較、選択することができます。HAQM Bedrock では、自動評価と人間による評価を選択できます。精度、堅牢性、毒性などのメトリクス用の事前定義されたをアルゴリズムを備えた自動評価を使用できます。モデル評価には、厳選されたデータセットが組み込まれていますが、独自のデータセットを持ち込むこともできます。

HAQM Bedrock のインタラクティブなインターフェイスで、モデルの評価のガイドが行われます。必要なのは、人間による評価を選択し、タスクのタイプとメトリクスを選択して、プロンプトデータセットをアップロードするだけです。その後、HAQM Bedrock が評価を実行してレポートを生成するので、選択したメトリクスに対してモデルがどのように機能したかを簡単に理解し、ユースケースに適したものを選択できます。このレポートを HAQM Bedrock のコストとレイテンシーのメトリクスと組み合わせて使用することで、必要な品質、コスト、レイテンシーのトレードオフを満たすモデルを選択できます。

HAQM Bedrock のモデル評価は、多くの商用リージョンに加えて AWS GovCloud (米国西部) でも一般提供になりました。

HAQM Bedrock でのモデル評価の詳細については、HAQM Bedrock のデベロッパーエクスペリエンスのウェブページをご覧ください。開始するには、AWS マネジメントコンソールで HAQM Bedrock にサインインするか、HAQM Bedrock API を使用してください。