HAQM Web Services ブログ

Category: HAQM SageMaker JumpStart

明けましておめでとうございます! AWS Weekly Roundup: 2025 年のテクノロジーに関する予測、Llama 3.3 70B、Stable Diffusion 3.5 Large、カスタム請求ビューなど (2025 年 1 月 6 日)

明けましておめでとうございます! 私たちは、テクノロジーがインスピレーションに富む方法で人間の創意工夫を強化す […]

LLM の埋め込み情報ドリフトを HAQM SageMaker JumpStart から監視する

生成 AI のワークロードで最も有用なアプリケーションパターンの 1 つが Retrieval Augmented Generation (RAG) パターンです。 RAG パターンでは、入力プロンプトに関連する参照コンテンツを探すために、埋め込みベクトル (テキスト文字列の数値表現) に対して類似検索を実行します。埋め込みはテキストの情報内容を捉え、自然言語処理 (NLP) モデルが言語を数値的に処理できるようにします。埋め込みは浮動小数点ベクトルであるため、3 つの重要な質問を用いて分析することができます。参照データは時間とともに変化するか、ユーザーが尋ねる質問は時間とともに変化するか、そして最後に、参照データが尋ねられている質問をどの程度カバーできているかです。