- Machine Learning›
- Amazon Polly›
- Häufig gestellte Fragen
Häufig gestellte Fragen zu Amazon Polly
Allgemeines
Was ist Amazon Polly?
Amazon Polly ist ein Service, der Text in natürliche Sprache konvertiert. Amazon Polly ermöglicht als Funktion erster Klasse vorhandenen Anwendungen das Sprechen und schafft die Möglichkeit für eine völlig neue Kategorie von sprachaktivierten Produkten, von mobilen Apps und Fahrzeugen bis hin zu Geräten und Einrichtungen. Amazon Polly verfügt über Dutzende naturgetreue Stimmen und unterstützt mehrere Sprachen. So können Sie die ideale Stimme auswählen und Ihre sprachaktivierten Anwendungen in vielen Geografien verteilen. Amazon Polly ist benutzerfreundlich – Sie senden einfach den Text, den Sie in Sprache konvertieren möchten, an die Amazon Polly-API und Amazon Polly gibt automatisch den Audiodatenstrom an die Anwendung zurück. Diesen Audiodatenstrom können Sie dann direkt wiedergeben oder in einem Standardformat für Audiodateien wie z. B. MP3 speichern. Amazon Polly unterstützt SSML-Tags (Speech Synthesis Markup Language) wie Prosody. Damit können Sie das Sprechtempo sowie die Tonhöhe und die Lautstärke der Sprachausgabe anpassen. Amazon Polly ist ein sicherer Service, der all diese Vorteile bei umfangreicher Skalierung und geringer Latenz bietet. Sie können die durch Amazon Polly generierten Sprachdateien ohne Zusatzkosten zwischenspeichern und erneut abspielen. Mit Amazon Polly können Sie im ersten Jahr ab Anmeldung Millionen von Zeichen pro Monat kostenlos umwandeln. Amazon Polly bietet dank der nutzungsbasierten Bezahlung, der geringen Gebühr pro Abfrage und der uneingeschränkten Speicher- und Wiederverwendungsmöglichkeit der Sprachausgabe eine kosteneffiziente Alternative für die Sprachsynthese überall.
Weshalb sollte ich Amazon Polly verwenden?
Sie können Amazon Polly verwenden, um Ihre Anwendung durch eine hochwertige Sprachausgabe zu unterstützen. Dieser kosteneffiziente Service bietet äußerst geringe Antwortzeiten und ist praktisch für jeden Anwendungsfall verfügbar, wobei keine Einschränkungen bei der Speicherung und Wiederverwendung der generierten Sprachausgabe bestehen.
Welche Funktionen werden unterstützt?
Sie können verschiedene Aspekte der Sprache wie z. B. Aussprache, Lautstärke, Tonhöhe, Sprechtempo usw. unter Verwendung der standardisierten Speech Synthesis Markup Language (SSML) steuern. Sie können Sprache für bestimmte Neuralstimmen mit dem Nachrichtensprecher-Stil synthetisieren, um sie wie ein Fernseh- oder Radiosprecher klingen zu lassen. Anhand der im Audio-Stream enthaltenen Metadaten können Sie erkennen, wann bestimmte Wörter oder Sätze im Text an den Benutzer gesprochen werden. Auf diese Weise kann der Entwickler grafische Hervorhebungen und Animationen, wie etwa die Lippenbewegungen eines Avatars, mit der synthetisierten Sprache synchronisieren. Sie können die Aussprache bestimmter Worte wie z.B. Firmennamen, Akronymen, Fremdwörtern und Neologismen, wie z.B. “P!nk”, “ROTFL”, “C’est la vie” (bei Aussprache mit nicht-französischer Stimme) mit Hilfe benutzerdefinierter Lexika verändern.
Was sind Speech Marks?
Speech Marks wurden entwickelt, um die synthetisierte Sprache, die aus dem Eingabetext generiert wird, zu ergänzen. Mithilfe dieser Metadaten und des Audio-Streams mit synthetisierter Sprache können Kunden Ihren Anwendungen eine erweiterte visuelle Erfahrung verleihen, wie etwa sprachsynchronisierte Animationen oder Hervorhebungen im Karaoke-Stil.
Amazon Polly generiert Speech Marks mithilfe der folgenden vier Elemente:
- Satz: weist auf ein Satzelement im zu sprechenden Eingabetext hin;
- Wort: weist auf ein Wortelement im Text hin;
- Mundbild: beschreibt die Form der Lippen, die dem gesprochenen Laut entspricht;
- SSML: beschreibt ein im Text verwendetes SSML-Element.
Bei Verwendung der Methode einer synthetisierten Sprache mit dem Parameter für Speech Mark-Typen werden Speech Marks in Form eines JSON-Streams bereitgestellt – genauer gesagt, durch eine Gruppe eigenständiger JSON-Objekte, die jeweils durch neue Zeilen abgegrenzt sind. Sie können eines, aber auch alle vier dieser Elemente enthalten. Weitere Informationen finden Sie im Entwicklerhandbuch für Amazon Polly.
Was sind die häufigsten Anwendungsfälle für diesen Service?
Mit Amazon Polly können Sie Ihren Anwendungen Leben einhauchen, indem Sie ihnen naturgetreue Sprachfunktionen hinzufügen. Sie können beispielsweise im Bildungs- und E-Learning-Bereich die Text-zu-Sprache-Funktion (TTS) von Amazon Polly nutzen, um Anwendungen zu erstellen, die Personen mit Leseschwächen unterstützen. Amazon Polly kann verwendet werden, um blinden und sehbehinderten Menschen den Konsum von digitalem Inhalt (eBooks, Nachrichten usw.) zu ermöglichen. Amazon Polly kann für Ansagesysteme in öffentlichen Verkehrsmitteln und bei Industriesteuerungen für Benachrichtigungen und Notfallansagen eingesetzt werden. Es gibt eine Vielzahl von Geräten, wie Set-Top-Boxen, Smartwatches, Tablets, Smartphones und IoT-Geräte, die Amazon Polly für die Sprachausgabe nutzen können. Amazon Polly kann für Telefonielösungen verwendet werden, um interaktiven Sprachantwortsystemen eine Stimme zu verleihen. Anwendungen wie Ratespiele, Animationen, Avatars oder Audiokommentare sind häufige Anwendungsfälle für cloudbasierte TTS-Lösungen wie Amazon Polly.
Wie funktioniert das Produkt mit anderen AWS-Produkten?
In Kombination mit Amazon Lex können Entwickler komplette Benutzerschnittstellen für Spracheingabe für ihre Anwendungen erstellen. Innerhalb von Amazon Connect wird Amazon Polly-Sprache verwendet, um Cloud-basierte Kontaktcenter-Self-Service-Services zu erstellen. Darüber hinaus können Entwickler von mobilen Apps und Lösungen für das Internet der Dinge (IoT) Amazon Polly nutzen, um ihren eigenen Systemen eine Sprachausgabe hinzuzufügen.
Welche Vorteile hat eine cloudbasierte Text-zu-Sprache-Lösung gegenüber einer gerätebasierten Lösung?
Bei gerätebasierten Text-zu-Sprache-Lösungen müssen erhebliche Rechenressourcen, insbesondere CPU-Leistung, RAM und Festplattenspeicher, auf dem Gerät zur Verfügung stehen. Dies kann zu höheren Entwicklungskosten und höherem Energiebedarf bei Geräten wie Tablets, Smartphones usw. führen. Im Gegensatz dazu reduziert die Umwandlung von Text zu Sprache in der Cloud deutlich den lokalen Ressourcenbedarf. Dies ermöglicht die Unterstützung aller verfügbaren Sprachen und Stimmen in bestmöglicher Qualität. Darüber hinaus sind Sprachkorrekturen und -verbesserungen für alle Endbenutzer sofort verfügbar und erfordern keine zusätzliche Aktualisierung aller Geräte. Cloudbasiertes TTS (Text-zu-Sprache) ist plattformunabhängig und verringert die Zeit und den Aufwand bei der Entwicklung.
Was sind die ersten Schritte bei Amazon Polly?
Melden Sie sich einfach in Ihrem AWS-Konto an und navigieren Sie zur Amazon Polly-Konsole (Teil der AWS-Konsole). Sie können dann über die Konsole einen beliebigen Text eingeben und den erzeugten Audiodatenstrom wiedergeben oder ihn als Audiodatei speichern.
In welchen Regionen ist der Service verfügbar?
Alle Regionen, die die Standardstimmen von Amazon Polly unterstützen, finden Sie in der Liste der regionalen AWS-Services. Neuralstimmen werden in der folgenden Teilmenge dieser Regionen unterstützt: USA Ost (Nord-Virginia), USA West (Oregon), Kanada (Zentral), Asien-Pazifik (Tokio), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Afrika (Kapstadt), EU (London), EU (Frankfurt), EU (Ireland) und AWS GovCloud (USA-West).
Welche Programmiersprachen werden unterstützt?
Amazon Polly unterstützt alle Programmiersprachen des AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go, and C++) und des AWS Mobile SDK (iOS/Android). Amazon Polly unterstützt auch die HTTP-API, so dass Sie Ihre eigene Zugriffsebene implementieren können.
Welche Audioformate werden unterstützt?
Mit Amazon Polly können Sie Audiodaten in Fast-Echtzeit an Benutzer übertragen. Außerdem können Sie aus vielen Abtastraten auswählen, um Bandbreite und Tonqualität für Ihre Anwendung zu optimieren. Amazon Polly unterstützt MP3, Vorbis und unkomprimierte PCM-Audiostream-Formate.
Welche Sprachen werden unterstützt?
Eine vollständige Liste der von Amazon Polly unterstützten Sprachen finden Sie in der Dokumentation.
Gibt es AWS-Service-Limits für Amazon Polly?
AWS hat Service-Limits für alle Konten, um die Verfügbarkeit der AWS-Ressourcen garantieren und die Risiken für neue Kunden in Hinblick auf die Fakturierung minimal halten zu können. Wenn Sie Amazon Polly zur Ausführung Ihrer Anwendung mit hohem Qualitätsdurchsatz nutzen, gibt es hierfür standardmäßige Service-Limits, einschließlich Drosselungsgrenzen, und Beschränkungen zur Nutzung von Vorgängen und der SSML (Speech Synthesis Markup Language). Weitere Informationen finden Sie im Amazon Polly-Entwicklerhandbuch unter Limits in Amazon Polly. Durch die Kombination mit anderen AWS Services, wie AWS Batch für eine effizientere Batch-Verarbeitung, können Sie für eine optimale Nutzung von Amazon Polly innerhalb der Service-Limits sorgen.
Ist Amazon Polly HIPAA-zertifiziert?
A: Amazon Polly ist ein Dienst, der die HIPAA-Voraussetzungen im Business Associate Addendum (AWS BAA) erfüllt. Wenn Sie ein AWS BAA einsetzen, verwendet, verwaltet und legt Amazon Polly Ihre geschützten patientenbezogenen Daten nur soweit dies hinsichtlich der Bedingungen Ihres AWS BAA erlaubt ist, offen, und nicht wie im Abschnitt mit den Datenschutzbestimmungen aus den häufig gestellten Fragen zu Amazon Polly beschrieben.
Was sind die ersten Schritte bei Amazon Polly Brand Voice?
Wenn Sie daran interessiert sind, eine Brand Voice mit Amazon Polly aufzubauen, wenden Sie sich bitte an Ihren AWS Account Manager oder kontaktieren Sie uns, um weitere Informationen zu bekommen.
Wie hoch sind die Kosten und der Zeitrahmen für den Aufbau einer Brand Voice?
Jede Voice ist einzigartig, daher ist es wichtig, dass wir mehr über Ihre Ziele erfahren, um ein Brand-Voice-Engagement genau abzugrenzen. Wenn Sie daran interessiert sind, eine Brand Voice mit Amazon Polly aufzubauen, wenden Sie sich bitte an Ihren AWS Account Manager oder kontaktieren Sie uns, um weitere Informationen zu bekommen.
Fakturierung
Wie viel kostet Amazon Polly?
Aktuelle Preisinformationen finden Sie auf der Seite mit der Preisübersicht für Amazon Polly.
Kann ich den Service zum Erzeugen von statischen Sprachansagen verwenden, die mehrmals wiedergegeben werden?
Ja, das ist möglich. Es besteht keine Einschränkung dieser Funktion und es entstehen keine zusätzlichen Kosten.
Kann ich den Service zum Erzeugen von Inhalt verwenden, der in Massenansagesystemen (z. B. an Bahnhöfen) verwendet wird?
Ja, das ist möglich. Es besteht keine Einschränkung dieser Funktion und es entstehen keine zusätzlichen Kosten.
Ich fordere die Synthetisierung von 1 000 Zeichen und Speech Marks mit den gleichen 1 000 Zeichen an. Werden mir in diesem Fall 2 000 Zeichen in Rechnung gestellt?
Ja. Ihnen werden für jede Anforderung von Sprache oder Speech Marks basierend auf der Anzahl der Zeichen, die Sie an den Service senden, alle Zeichen in Rechnung gestellt.
Ist Amazon Polly Teil des kostenlosen AWS-Nutzungskontingents?
Ja, im Rahmen des kostenlosen Nutzungskontingents von AWS können Sie Amazon Polly zum Einstieg kostenlos nutzen. Nach der Anmeldung bei Amazon Polly können neue Kunden jeden Monat Millionen von Zeichen kostenlos während der ersten 12 Monate synthetisieren. Aktuelle Preisinformationen finden Sie auf der Seite mit der Preisübersicht für Amazon Polly.
Sind Steuern bereits in den Preisen enthalten?
Weitere Einzelheiten finden Sie unter Amazon Web Services – Steuerhilfe.
Datenschutz
Werden durch Amazon Polly verarbeitete Texteingaben gespeichert und wie werden sie von AWS verwendet?
Amazon Polly darf Texteingaben, die vom Service verarbeitet werden, nur in einem Rahmen speichern, der für die Bereitstellung und Aufrechterhaltung des Service erforderlich ist oder die Verbesserung der Qualität von Amazon Polly und anderer Amazon-Technologien hinsichtlich Machine Learning/künstliche Intelligenz ermöglicht. Die Nutzung Ihrer Inhalte ist wichtig für die kontinuierliche Verbesserung Ihrer Amazon Polly-Kundenerfahrung, einschließlich der Entwicklung und des Trainings entsprechender Technologien. Wir verwenden keine personenbezogenen Informationen, die in Ihren Inhalten enthalten sein können, um Produkte, Services oder Marketingmaterialien auf Sie oder Ihre Endbenutzer abzuzielen. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/. Mit einer der Opt-Out-Mechanismen von AWS Organizations können Sie die Nutzung Ihrer Inhalte zur Verbesserung und Weiterentwicklung der Qualität von Amazon Polly und anderen ML/KI-Technologien von Amazon ablehnen. Informationen zu Ihren Opt-Out-Möglichkeiten finden Sie unter Verwaltung der Opt-Out-Richtlinie für KI-Services.
Wer hat Zugriff auf meine von Amazon Polly verarbeiteten und gespeicherten Inhalte?
Nur autorisierte Mitarbeiter haben Zugriff auf Ihre von Amazon Polly verarbeiteten und gespeicherten Inhalte. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/.
Bin ich immer noch der Eigentümer der Inhalte, die durch Amazon Polly verarbeitet und gespeichert werden?
Sie behalten immer die Eigentümerschaft an den Inhalten und wir verwenden Ihre Inhalte nur mit Ihrer Zustimmung.
Werden von Amazon Polly verarbeitete Inhalte außerhalb der AWS-Region verschoben, in der ich Amazon Polly verwende?
Alle Inhalte, die von Amazon Polly verarbeitet werden, werden verschlüsselt in der AWS-Region gespeichert, in der Sie Amazon Polly verwenden. Ein Teil der von Amazon Polly verarbeiteten Inhalte wird möglicherweise und ausschließlich im Rahmen der fortlaufenden Verbesserung des Kundenerlebnisses von Amazon Polly und anderen Amazon-Technologien hinsichtlich Machine Learning/künstlicher Intelligenz auch in anderen AWS-Regionen gespeichert. Wenn Sie die Option deaktivieren, dass Ihre Inhalte zur Weiterentwicklung von Amazon Polly und anderen Amazon-Technologien hinsichtlich Machine Learning/künstlicher Intelligenz verwendet werden, indem Sie den AWS Support kontaktieren, dann werden Ihre Inhalte nicht in einer anderen AWS-Region gespeichert. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/.
Kann ich Amazon Polly zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich an Kinder unter 13 Jahren richten und dem Children’s Online Privacy Protection Act (COPPA) unterliegen?
Ja, entsprechend der Konformität mit den Amazon Polly-Nutzungsbedingungen, einschließlich Ihrer Verpflichtung, alle erforderlichen Hinweise bereitzustellen und alle erforderlichen überprüfbaren elterlichen Freigaben unter dem COPPA anzufordern, können Sie Amazon Polly zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich ganz oder teilweise an Kinder unter 13 Jahren richten.
Wem gehören die Polly-Aufnahmen?
Was Sie und AWS betrifft, so gehört Ihre Polly-Ausgabe Ihnen. Wenn Sie einen Text in Polly eingeben, der einer dritten Partei gehört, verlangen von Ihnen die Berechtigung dafür. Weitere Informationen finden Sie in unserer Kundenvereinbarung und deren Umgang mit „Ihren Inhalten“
Wie ermittle ich, ob meine Website, mein Programm oder meine Anwendung dem COPPA unterliegt?
Informationen zu den Anforderung des COPPA und Hinweise darauf, ob Ihre Website, Ihr Programm oder Ihre Anwendung dem COPPA unterliegt, finden Sie direkt in den von der United States Federal Trade Commission bereitgestellten und verwalteten Ressourcen. Diese Website enthält außerdem Informationen, um zu ermitteln, ob sich ein Service ganz oder teilweise an Kinder unter 13 Jahre richtet.
Weitere Informationen zu den Preisen von Amazon Polly