投稿日: Jun 9, 2022
デベロッパーは AWS GovCloud (米国) リージョンで、HAQM Chime SDK のライブ文字起こしを使用して、ライブ音声の文字起こしができるようになりました。HAQM Chime SDK を使用すれば、デベロッパーはインテリジェントなリアルタイムでの音声、動画、画面共有を自身のウェブアプリケーションおよびモバイルアプリケーションに追加できます。AWS GovCloud (米国) により、米国政府関連機関や業者は、特定の規制およびコンプライアンス要件に対処しつつ、コミュニケーションワークロードをクラウドに移行できます。
HAQM Chime SDK により、デベロッパーは両方の AWS GovCloud (米国) リージョンで WebRTC メディアセッションをホストできます。HAQM Chime SDK と HAQM Transcribe の統合により、「誰が何を言ったか」がわかる文字起こし情報を各セッションの参加者に直接配信できるようになりました。各ユーザーの音声は個別に処理されるため、複数の人が会話する際の精度が向上しています。トップ 2 のアクティブトーカーの音声は、単一のストリームを経由し、別々のチャネルで HAQM Transcribe に送信されます。デベロッパーは文字起こし情報を使用して、機械生成によるリアルタイムのキャプションをレンダリングしたり、セッションの文字起こしを動的に作成したりできます。
ライブ文字起こしは AWS GovCloud (米国西部) リージョンで HAQM Transcribe を使用し、HAQM Transcribe でサポートされているすべてのストリーミング言語、ならびに自動言語識別、語彙フィルター、コンテンツ識別、カスタム語彙、カスタム言語モデルなどへのアクセスを提供します。標準の HAQM Transcribe コストが適用されます。
HAQM Chime SDK および HAQM Transcribe でのライブ文字起こしの詳細については、以下のリソースを確認してください。
- HAQM Chime SDK と HAQM Transcribe のウェブサイト
- HAQM Chime SDK デベロッパーガイドのライブ文字起こしの使用
- HAQM Chime SDK API リファレンスのライブ文字起こし API