Veröffentlicht am: Nov 24, 2021
Mit dem HAQM Chime SDK können Entwickler ihren Web- oder mobilen Anwendungen Audio-, Video-, Bildschirmfreigabe- und Messaging-Funktionen in Echtzeit hinzufügen. Das HAQM Chime SDK bietet jetzt auf Machine Learning (ML) basierende Echoreduktion, um das Audioerlebnis zu verbessern. Akustische Echos stören Besprechungen oder Konferenzgespräche, wenn der vom Lautsprecher abgespielte Ton vom Mikrofon aufgenommen wird und wieder in den Anruf zirkuliert. Die neue ML-basierte Echoreduktionsfunktion wurde entwickelt, um akustische Echos zu reduzieren und die Sprachqualität bei Gesprächen zu erhalten, wenn zwei oder mehr Personen gleichzeitig sprechen.
Die Echoreduktion des HAQM Chime SDK umfasst auch HAQM Voice Focus, die Technologie, die zur Rauschreduktion im HAQM Chime SDK entwickelt wurde. HAQM Voice Focus verwendet Machine Learning und Sprach- und Hörmodelle, um Hintergrundgeräusche wie Ventilatoren, Rasenmäher und bellende Hunde sowie Vordergrundgeräusche wie Tippen und Blättern von Papieren zu reduzieren – damit Geräusche nicht von Gesprächen und Verabredungen ablenken. Entwickler können ihre Besprechungen mit Echoreduktionsfunktionen über die CreateMeeting-API aus dem HAQM Chime SDK konfigurieren. Nach der Konfiguration müssen Entwickler die Funktion zusätzlich auf Client-Ebene aktivieren, indem sie das entsprechende ML-Modell zur Echoreduktion anwenden, wenn Teilnehmer der Besprechung beitreten.
Die Verarbeitung für die HAQM-Chime-SDK-Echoreduktion erfolgt in Echtzeit mit WebAssembly (WASM) und Single Instruction Multiple Data (SIMD) für einen effizienten Betrieb auf den meisten modernen Computern und Browsern. Dieses Angebot ist derzeit im HAQM Chime SDK für Javascript verfügbar.
Weitere Informationen über das HAQM-Chime-SDK finden Sie in den folgenden Ressourcen:
- HAQM-Chime-SDK-Website
- HAQM Chime SDK für JavaScript
- HAQM Chime SDK-Entwicklerhandbuch
- HAQM Chime SDK Voice Focus API