HAQM Web Services ブログ
HAQM Bedrock Data Automation によるコンテキスト広告向けビデオインサイトの自動抽出
本記事は 2025 年 4 月 17 日に AWS Machine Learning Blog で公開された Automate video insights for contextual advertising using HAQM Bedrock Data Automation を翻訳したものです。翻訳はソリューションアーキテクトの川戸渉が担当しました。
ブログ翻訳時点 (2025 年 4 月) では、HAQM Bedrock Data Automation は英語をサポートしています。他の言語は未サポートです。
コンテキスト広告とは、デジタルコンテンツの内容に関連した広告を表示する戦略です。この手法によって視聴者が見ているコンテンツと関連性の高い広告を届けられるようになり、デジタルマーケティングに革新をもたらしています。しかし、ストリーミング型のビデオ・オン・デマンドコンテンツでは、このようなコンテキスト広告の実現が難しくなります。特にビデオのどのタイミングで広告を挿入するか、また視聴内容とどう関連付けるかという点で多くの課題があります。従来の方法では、コンテンツ分析は主に人手に頼っていました。たとえば、コンテンツ分析の担当者は恋愛ドラマを何時間も視聴し、感動的な告白シーンの直後でありながら結末の前という、視聴の流れを損なわない絶妙なタイミングに広告を配置します。その後、担当者はコンテンツに「ロマンス」「感動的」「家族向け」といったメタデータを手作業でタグ付けし、適切な広告とのマッチングを検証します。このような手作業によって、ストーリーの自然な流れを保ちながら番組内容に合った広告を表示できますが、大量のコンテンツに対してこの方法を実施するのは現実的ではありません。
生成 AI、特にマルチモーダル基盤モデル (foundation model, FM) の最近の進歩により、ビデオの内容を高度に理解できるようになりました。これらのモデルは、先ほど述べた課題に対する有望な解決策となっています。以前の記事 Media2Cloud on AWS Guidance: Scene and ad-break detection and contextual understanding for advertising using generative AI では、HAQM Bedrock の HAQM Titan Multimodal Embeddings G1 model と Anthropic Claude FM を使ったカスタムワークフローを紹介しました。今回の記事では、コンテキスト広告ソリューションをより簡単に構築する方法について解説します。
HAQM Bedrock Data Automation (BDA) は、HAQM Bedrock の FM を活用した新しいマネージド機能です。BDA は、ドキュメント、イメージ、ビデオ、オーディオなどの非構造化コンテンツから構造化されたデータを抽出することで、従来必要であった複雑なカスタムワークフローを簡略化できます。この記事では、BDA を活用して、チャプターセグメントやオーディオセグメントなどの豊富なビデオインサイトの自動抽出、シーン内のテキスト認識、Interactive Advertising Bureau (IAB) のカテゴリ分類の方法を示します。そして、これらのインサイトを使用して、ビデオを中断せずに表示される「ノンリニア広告」のソリューションを構築し、コンテキスト広告の効果を高める手法を紹介します。サンプルの Jupyter Notebook は、GitHub リポジトリで利用可能です。
ソリューションの概要
ノンリニア広告とは、再生を中断せずにメインのビデオコンテンツと同時に表示されるデジタルビデオ広告のことです。こうした広告は、ビデオプレーヤーの上にオーバーレイ、グラフィック、またはリッチメディア要素として表示され、多くの場合は画面の下部に表示されます。以下のスクリーンショットは、この記事で実装するノンリニア広告ソリューションの例です。
以下の図は、アーキテクチャとその主要コンポーネントの概要を示しています。
ワークフローは次の通りです:
- ユーザーが HAQM Simple Storage Service (HAQM S3) にビデオをアップロードします。
- 新しいビデオがアップロードされるたびに AWS Lambda 関数が起動し、ビデオ分析のために BDA が開始されます。ビデオ分析は非同期ジョブとして実行されます。
- 分析結果は出力用の S3 バケットに保存されます。
- ダウンストリームシステム (AWS Elemental MediaTailor) は、BDA が抽出したチャプターセグメンテーション、コンテキストインサイト、メタデータ(IAB 分類など)を活用して、ビデオ内でより効果的な広告の選択と配置が行えるようになります。
サンプルノートブックでは、実装を簡略化するために、ビデオのメタデータと表示する広告ファイルの対応表を用意しています。これは、MediaTailor がコンテンツマニフェストファイルを処理し、広告決定サービスから最適な広告を取得する仕組みを模擬したものです。
前提条件
この記事の例とノートブックを実行するには、以下の前提条件が必要です:
- サンプルノートブックを動かすための適切な権限を持つ AWS アカウント (HAQM Bedrock、HAQM S3 へのアクセス権限を含む) と Jupyter Notebook 環境
- HAQM Bedrock API にアクセスするための適切な権限を持つ Jupyter Notebook 環境。HAQM Bedrock ポリシー設定について詳しくは、Get credentials to grant programmatic access を参照してください
- コードを実行する前に、FFmpeg、open-cv、webvtt-py などのサードパーティライブラリをインストールしておく必要があります
- Creative Commons Attribution 4.0 International Public License のもとで Netflix Open Content から提供される Meridian という短編映画をサンプルビデオとして使用します
BDA を使用したビデオ分析
BDA の導入により、ビデオ処理と分析の作業が格段に簡単になりました。全体のワークフローは 3 つの主要ステップで構成されています。プロジェクトの作成、分析の実行、結果の取得です。最初のステップであるプロジェクトの作成では、繰り返し利用できる分析設定のテンプレートを作ります。このプロジェクト内で、どのような分析を行いたいか、また結果をどのように構造化するかを定義します。プロジェクトの作成には BDA boto3 クライアントの create_data_automation_project API を使用します。この API は dataAutomationProjectArn という識別子を返し、これを各ランタイム実行時に指定する必要があります。
コンテキスト広告ソリューション
BDA から得られた分析結果を活用して、ノンリニア広告ソリューションを構築してみましょう。従来のリニア広告は事前に決められた時間枠に広告を表示しますが、ノンリニア広告はコンテンツの文脈に基づいて動的に広告を配置できます。チャプターレベルでは、BDA がビデオを自動的に分割し、コンテンツの要約、IAB カテゴリ、正確な時間情報といった詳細な分析データを生成します。これらのデータは広告配置のための効果的な指標となり、広告主は自社の宣伝内容に合致する特定のチャプターをターゲットにできます。
実例として、様々な広告画像を用意し、それぞれを特定の IAB カテゴリに関連付けました。BDA がチャプターの IAB カテゴリを特定すると、システムは自動的にリストから最も関連性の高い広告を選び出し、そのチャプターの再生中に画面上に重ねて表示します。下の例では、BDA が田舎道を走る車のシーン (IAB カテゴリ: 自動車、旅行) を識別すると、システムは事前に関連付けられた広告データベースから空港のスーツケースの広告を選択して表示します。この自動マッチングの仕組みにより、視聴の流れを妨げずに、コンテンツに関連した適切な広告配置が可能になります。
クリーンアップ
不要な課金を防ぐため、ノートブックのクリーンアップセクションの手順に従って、作成したプロジェクトとリソースを削除してください。BDA のコストに関する詳細については、HAQM Bedrock の料金を参照してください。
まとめ
HAQM Bedrock の基盤モデルを活用した HAQM Bedrock Data Automation は、ビデオ分析技術を大きく改善しています。BDA は、ビデオコンテンツの深い分析に必要だった複雑な処理工程を大幅に簡素化しました。これにより、従来は専門的な技術知識が必要だった作業が、誰でも扱える使いやすいソリューションへと生まれ変わりました。この画期的な技術により、メディア企業は運用の手間を減らしながら、視聴者一人ひとりの興味に合わせた、より魅力的な広告を届けられるようになります。GitHub リポジトリで公開されているサンプルの Jupyter Notebook を使って、ぜひ BDA を実際にお試しください。また、以下のリソースでは、テキストや画像など他の形式での BDA の活用事例もご覧いただけます:
- Simplify multimodal generative AI with HAQM Bedrock Data Automation
- HAQM Bedrock のデータオートメーションを利用してマルチモーダルコンテンツからインサイトを取得する (一般提供が開始されました)
著者について
James Wu は AWS のシニア AI/ML スペシャリストソリューションアーキテクトとして、お客様の AI/ML ソリューション設計・構築をサポートしています。James は幅広い機械学習の活用事例に携わっており、特にコンピュータービジョン、ディープラーニング、企業全体での機械学習のスケーリングに力を入れています。 AWS 入社以前は、エンジニアリング分野で 6 年間、マーケティングと広告業界で 4 年間を含む 10 年以上の経験を持ち、アーキテクト、開発者、テクノロジーリーダーとしてのキャリアを積んできました。
Alex Burkleaux は AWS のシニア AI/ML スペシャリストソリューションアーキテクトを務めています。彼女は AI サービスを活用して生成 AI によるメディアソリューションの構築するお客様をサポートしています。彼女の業界経験には、オーバーザトップビデオ、データベース管理システム、信頼性エンジニアリングが含まれています。