Veröffentlicht am: Jun 9, 2022

Entwickler können ab sofort die Live-Transkription mit dem HAQM Chime SDK in AWS GovCloud (USA)-Regionen verwenden, um Live-Audio-Transkriptionen zu erzeugen. Mit dem HAQM Chime SDK können Entwickler eine intelligente Echtzeit-Audio, -Video und -Bildschirmfreigabe zu ihren Web- und Mobilanwendungen hinzufügen. Die Erweiterung in die AWS GovCloud (USA)-Regionen ermöglicht es US-Regierungsbehörden und Auftragnehmern, Kommunikations-Workloads in die Cloud zu verlagern und gleichzeitig ihre spezifischen regulatorischen und Compliance-Anforderungen zu erfüllen.

Mit dem HAQM Chime SDK können Entwickler WebRTC-Mediensitzungen in beiden AWS GovCloud (USA)-Regionen hosten. Das HAQM Chime SDK ist mit HAQM Transcribe integriert, um jedem Sitzungsteilnehmer direkt die Transkriptionsinformationen „Wer hat was gesagt“ zu liefern. Die Audiosignale jedes Benutzers werden einzeln verarbeitet, um die Genauigkeit zu verbessern, wenn mehrere Personen miteinander sprechen. Die Audiosignale der ersten beiden aktiven Sprecher werden in getrennten Kanälen über einen einzigen Stream an HAQM Transcribe gesendet. Entwickler können die Transkriptionsinformationen verwenden, um in Echtzeit maschinell erzeugte Untertitel zu rendern oder dynamisch ein Sitzungsprotokoll zu erstellen.

Die Live-Transkription verwendet HAQM Transcribe in der Region AWS GovCloud (USA-West) und bietet Zugriff auf alle von HAQM Transcribe unterstützten Streaming-Sprachen sowie Funktionen wie automatische Spracherkennung, Vokabularfilter, Inhaltserkennung, benutzerdefinierte Vokabulare und benutzerdefinierte Sprachmodelle. Es gelten Standard-HAQM-Transcribe-Kosten.

Um mehr über das HAQM-Chime-SDK und die Live-Transkription mit HAQM Transcribe zu erfahren, lesen Sie die folgenden Ressourcen: