- Machine Learning›
- Amazon Polly›
- Perguntas frequentes
Perguntas frequentes sobre o Amazon Polly
Geral
O que é o Amazon Polly?
O Amazon Polly é um serviço que transforma texto em falas realistas. O Amazon Polly permite que aplicações atuais usem um recurso de fala de alto nível e cria oportunidades para categorias totalmente novas de produtos com fala, que abrangem de aplicações móveis e veículos a dispositivos e eletrodomésticos. O Amazon Polly inclui dezenas de vozes realistas e aceita vários idiomas, o que permite selecionar a voz ideal e distribuir aplicações com recursos de fala em várias regiões diferentes. O Amazon Polly é fácil de usar. Basta enviar o texto a ser convertido em fala à API do Amazon Polly. A aplicação receberá imediatamente o stream de áudio do Amazon Polly para reprodução direta ou armazenamento em formato de arquivo de áudio padrão, como MP3. O Amazon Polly permite tags de Speech Synthesis Markup Language (SSML), como prosódia, o que permite ajustar a velocidade, o tom e o volume das falas. O Amazon Polly é um serviço seguro que oferece todos esses benefícios em grande escala e com baixa latência. É possível armazenar em cache e reproduzir a fala gerada pelo Amazon Polly sem custos adicionais. Após o cadastro, o Amazon Polly permite converter gratuitamente milhões de caracteres por mês durante o primeiro ano. A definição de preço com pagamento conforme o uso, o baixo custo por solicitação e a inexistência de restrições de armazenamento e reutilização da saída de fala do Amazon Polly fazem dele uma forma econômica de utilizar síntese de fala em qualquer lugar.
Por que devo usar o Amazon Polly?
Você pode usar o Amazon Polly para usar saídas de fala de alta qualidade em aplicações. Esse serviço econômico oferece tempos de resposta muito baixos e está disponível para praticamente qualquer caso de uso, sem restrições de armazenamento e reutilização das falas geradas.
Quais recursos estão disponíveis?
Você pode controlar vários aspectos da fala como pronúncia, volume, tom e velocidade, entre outros, usando Speech Synthesis Markup Language (SSML) padrão. Você pode sintetizar a fala de certas vozes neurais usando o estilo de noticiários para que soem como um apresentador de TV ou rádio. Você pode detectar quando palavras ou frases específicas no texto estão sendo faladas para o usuário com base nos metadados inclusos no stream de áudio. Isso permite que o desenvolvedor sincronize destaque gráfico e animações, como os movimentos de lábios de um avatar, com a fala sintetizada. Você pode modificar a pronúncia de palavras específicas, como nomes de empresas, acrônimos, palavras estrangeiras e neologismos, p.ex., “P!nk”, “ROTFL”, “C’est la vie” (quando falado em uma voz não francesa) usando léxicos personalizados.
O que são as marcas de fala?
As marcas de fala foram criadas para complementar a fala sintetizada gerada por meio do texto de entrada. Ao usar esses metadados junto com o stream de áudio de fala sintetizada, os clientes poderão disponibilizar às suas aplicações uma experiência visual otimizada, oferecendo recursos como animação sincronizada com a fala ou destaque em estilo de karaokê.
O Amazon Polly gera marcas de fala usando os quatro seguintes elementos:
- Frase, que indica um elemento de frase no texto de entrada a ser falado;
- Palavra, que indica um elemento de palavra no texto;
- Visema, que descreve o formato dos lábios que corresponde ao som falado;
- SSML, que descreve um elemento SSML usado no texto.
As marcas de fala são fornecidas no formato de um fluxo JSON (especificamente, um conjunto de objetos JSON autônomos delimitados por novas linhas) que contém de um a todos esses quatro elementos quando o método synthesize-speech é usado com o parâmetro speech-mark-types. Você pode encontrar mais informações no Guia do desenvolvedor do Amazon Polly.
Quais são os casos de uso mais comuns para esse serviço?
O Amazon Polly permite que você dê vida às aplicações adicionando recursos de fala realistas. Por exemplo, você pode criar aplicações para e-learning e educação usando o recurso de conversão de texto em fala (TTS) do Amazon Polly para ajudar as pessoas com deficiências de leitura. O Amazon Polly pode ser usado para ajudar pessoas com deficiências visuais a consumir conteúdo digital (eBooks, notícias, etc.). Também é possível usar o Amazon Polly em sistemas de alto-falantes para anunciar notificações e emergências em sistemas de transporte público e controle industrial. Existe uma grande variedade de dispositivos como decodificadores, smartwatches, tablets, smartphones e dispositivos de IoT que pode utilizar o Amazon Polly para oferecer saída de áudio. O Amazon Polly pode ser usado em soluções de telefonia como voz para sistemas de resposta de voz interativa (IVR). Aplicações como quebra-cabeças, animações, avatars ou geração de narrativas são casos de uso comuns para soluções de TTS com base em nuvem como o Amazon Polly.
Como esse produto funciona com outros produtos da AWS?
A combinação com o Amazon Lex permite que os desenvolvedores criem interfaces de usuário completas com voz para os aplicativos. No Amazon Connect, a fala do Amazon Polly é usada para criar serviços de central de atendimento baseados na nuvem no modelo de autoatendimento. Além disso, os desenvolvedores de aplicativos móveis e da Internet das Coisas (IoT) podem usar o Amazon Polly para adicionar saída falada a seus próprios sistemas.
Quais são as vantagens de uma solução de conversão de texto em fala com base na nuvem em relação a soluções de dispositivos?
As soluções de conversão de texto em fala em dispositivos exigem recursos de computação consideráveis, principalmente capacidade de CPU, RAM e espaço em disco para serem disponibilizadas nos dispositivos. Isso pode resultar em maior custo de desenvolvimento e consumo de energia em dispositivos como tablets, smartphones, etc. Por outro lado, a conversão de texto em fala na nuvem reduz drasticamente os requisitos de recursos locais. Com isso, é possível usar todas as linguagens e vozes disponíveis com a maior qualidade possível. Além disso, as correções e aprimoramentos das falas são disponibilizados instantaneamente a todos os usuários finais, sem necessidade de atualizações adicionais em todos os dispositivos. A conversão de texto em fala (TTS) na nuvem independe de plataforma, minimizando o tempo e os esforços de desenvolvimento.
Como faço para começar a usar o Amazon Polly?
Basta fazer login na sua conta da AWS e navegar até o console do Amazon Polly (que é parte do console da AWS). No console, você pode digitar qualquer texto e ouvir a fala gerada ou salvá-la como um arquivo de áudio.
Em quais regiões o serviço está disponível?
Consulte a Lista de serviços regionais da AWS para ver todas as regiões que oferecem suporte às vozes padrão do Amazon Polly. O seguinte subconjunto dessas regiões oferece suporte às vozes neurais: Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Canadá (Central), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Seul), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), África (Cidade do Cabo), UE (Londres), UE (Frankfurt), UE (Irlanda) e AWS GovCloud (EUA-Oeste).
Quais são as linguagens de programação compatíveis?
O Amazon Polly é compatível com todas as linguagens de programação incluídas no AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go e C++) e no AWS Mobile SDK (iOS/Android). Além disso, o Amazon Polly também aceita a API do HTTP, permitindo que você implemente sua própria camada de acesso.
Quais são os formatos de áudio compatíveis?
O Amazon Polly permite fazer streaming de áudio para os usuários em tempo quase real. Além disso, você pode escolher entre diversas taxas de amostragem para otimizar a largura de banda e a qualidade de áudio da aplicação. O Amazon Polly é compatível com os formatos de streaming de áudio MP3, Vorbis e PCM bruto.
Quais idiomas são compatíveis?
Consulte a documentação para obter a lista completa de idiomas compatíveis com o Amazon Polly.
O Amazon Polly tem Service Limits da AWS?
Para ajudar a garantir a disponibilidade de recursos da AWS e minimizar o risco de faturamento para novos clientes, a AWS mantém Service Limits para cada conta. Ao usar o Amazon Polly para capacitar sua aplicação com saída de fala de alta qualidade, existirão Service Limits padrão, como limitações de controle de fluxo, operações e uso de SSML. Para obter detalhes, consulte Limites no Amazon Polly no Guia do desenvolvedor do Amazon Polly. A combinação do Amazon Polly com outros serviços da AWS, como o AWS Batch para o processamento de lotes eficiente, pode ajudar a aproveitar o Amazon Polly ao máximo dentro dos Service Limits mencionados.
O Amazon Polly é certificado pela HIPAA?
R: O Amazon Polly é um serviço qualificado para a HIPAA, coberto pelo Adendo de associado comercial da AWS (BAA da AWS). Se você tiver um BAA da AWS implementado, o Amazon Polly usará, divulgará e manterá as Protected Health Information (PHI – Informações protegidas de saúde) exclusivamente da forma permitida pelos termos do AWS BAA, e não como especificado na seção de privacidade de dados das perguntas frequentes sobre o Amazon Polly.
Como faço para começar a usar o Brand Voice do Amazon Polly?
Se você tem interesse em criar um Brand Voice usando o Amazon Polly, entre em contato conosco ou com o gerente da sua Conta da AWS para obter mais informações.
Qual o custo e o cronograma para criar um Brand Voice?
Toda voz é única, por isso é importante aprendermos mais sobre suas metas para definir um escopo preciso para o envolvimento do Brand Voice. Se você tem interesse em criar um Brand Voice usando o Amazon Polly, entre em contato conosco ou com o gerente da sua Conta da AWS para obter mais informações.
Faturamento
Qual é o custo do Amazon Polly?
Consulte a página de definição de preço do Amazon Polly para obter informações de definição de preço atualizadas.
Posso usar o serviço para gerar frases estáticas que serão reproduzidas várias vezes?
Sim, você pode. O serviço permite esse uso sem custos adicionais.
Posso usar o serviço para gerar conteúdo para sistemas de notificação em massa (por exemplo, em uma estação de trem)?
Sim, você pode. O serviço permite esse uso sem custos adicionais.
Se eu solicitar que 1.000 caracteres sejam sintetizados e solicitar marcas de fala com os mesmos 1.000 caracteres, serei cobrado por 2.000 caracteres?
Sim. Você será cobrado por cada solicitação de fala ou marcas de fala com base no número de caracteres enviados para o serviço.
O Amazon Polly participa do nível gratuito da AWS?
Como parte do nível de uso gratuito da AWS, você pode começar a utilizar o Amazon Polly gratuitamente. Após o cadastramento, os novos clientes do Amazon Polly poderão sintetizar gratuitamente milhões de caracteres por mês durante os primeiros 12 meses. Consulte a página de definição de preço do Amazon Polly para obter informações de definição de preço atualizadas.
Os preços incluem impostos?
Para obter detalhes fiscais, consulte a ajuda sobre impostos da Amazon Web Services.
Privacidade de dados
As entradas de texto processadas pelo Amazon Polly são armazenadas? Como são usadas pela AWS?
O Amazon Polly pode armazenar e usar entradas de texto processadas pelo serviço exclusivamente para oferecer e manter o serviço, bem como para melhorar e desenvolver a qualidade do Amazon Polly e de outras tecnologias de inteligência artificial/Machine Learning da Amazon. O uso do seu conteúdo é importante para a melhoria contínua da experiência do cliente do Amazon Polly, incluindo o desenvolvimento e o treinamento de tecnologias relacionadas. Não usamos nenhuma informação de identificação pessoal contida no conteúdo para direcionar produtos, serviços ou marketing para você ou para seus usuários finais. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para saber mais. Você pode optar por não ter seu conteúdo usado para melhorar e desenvolver a qualidade do Amazon Polly e de outras tecnologias de machine learning/inteligência artificial da Amazon usando uma política de desativação do AWS Organizations. Para obter informações sobre como optar por não participar, consulte Gerenciar a política de desativação de serviços de IA.
Quem tem acesso ao meu conteúdo processado e armazenado pelo Amazon Polly?
Somente funcionários autorizados terão acesso ao seu conteúdo processado pelo Amazon Polly. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para obter mais informações.
Meu conteúdo processado e armazenado pelo Amazon Polly continua sendo de minha propriedade?
Você sempre mantém a propriedade do conteúdo. Somente usaremos o seu conteúdo com o seu consentimento.
O conteúdo processado pelo Amazon Polly é movido para fora da região da AWS onde estou usando o Amazon Polly?
Todo o conteúdo processado pelo Amazon Polly é criptografado e armazenado quando ocioso na região da AWS onde você usa o Amazon Polly. Parte do conteúdo processado pelo Amazon Polly pode ser armazenado em outra região da AWS exclusivamente para fins de melhoria e desenvolvimento contínuos da sua experiência de cliente do Amazon Polly e de outras tecnologias de Machine Learning/inteligência artificial da Amazon. Se você pode optar por não ter seu conteúdo usado para melhorar e desenvolver a qualidade do Amazon Polly e de outras tecnologias de machine learning/inteligência artificial da Amazon entrando em contato com o AWS Support, o conteúdo não será armazenado em outra região da AWS. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para saber mais.
Posso usar o Amazon Polly em sites, programas ou outras aplicações criadas ou direcionadas para crianças menores de 13 anos de idade e sujeitos à Children’s Online Privacy Protection Act (COPPA – Lei de proteção da privacidade infantil online)?
Sim. Sujeito à sua conformidade com os termos de serviço do Amazon Polly, que incluem a sua obrigação de disponibilizar qualquer notificação exigida e obter todos os consentimentos parentais verificáveis exigidos pela COPPA, você poderá usar o Amazon Polly em sites, programas ou outros aplicativos criados ou direcionados, no todo ou em parte, para crianças menores de 13 anos de idade.
Quem é o detentor das gravações do Polly?
Como entre você e a AWS, sua saída do Polly pertence a você. Se você inserir texto no Polly que pertença a terceiros, exigiremos que você tenha os direitos para fazer isso. Para obter mais informações, consulte nosso Contrato do cliente e como ele lida com “Seu conteúdo”
Como posso determinar se um site, programa ou aplicação está sujeito à COPPA?
Para obter informações sobre os requisitos da COPPA e as diretrizes para determinar se um site, programa ou outro aplicativo está sujeito à COPPA, consulte diretamente os recursos disponibilizados e mantidos pela United States Federal Trade Commission (Comissão Federal de Comércio dos Estados Unidos). Esse website também contém informações sobre de como determinar se um serviço é direcionado ou criado, de modo integral ou parcial, para crianças menores de 13 anos.
Saiba mais sobre a definição de preço do Amazon Polly