Publicado: Dec 7, 2022

Hoje, temos o prazer de anunciar que os modelos de idiomas personalizados (CLM) do HAQM Transcribe agora oferecem suporte aos idiomas alemão e japonês nos modos em lote e de streaming. O HAQM Transcribe é um serviço de reconhecimento automático de fala (ASR) que facilita a adição de recursos de conversão de fala em texto às suas aplicações. O CLM permite que você use dados pré-existentes para criar um mecanismo de fala personalizado para os seus casos de uso específicos de transcrição em lote e de streaming. Nenhuma experiência prévia de machine learning é necessária para criar seu CLM.

O CLM usa dados de texto que você já possui, como conteúdo de site, manuais de instruções e outros ativos que abrangem o léxico e o vocabulário exclusivos do seu domínio. Carregue seu conjunto de dados de treinamento para criar um CLM e executar trabalhos de transcrição usando seu novo CLM. O CLM do HAQM Transcribe foi feito para clientes que operam em domínios diversificados, como direito, finanças, hospitalidade, seguros e mídia. Os CLMs são projetados para melhorar a precisão da transcrição da fala específica do domínio. Isso inclui qualquer conteúdo diferente do que você ouviria em conversas normais do dia a dia. Por exemplo, se você estiver transcrevendo os autos de uma conferência científica, será improvável que uma transcrição padrão reconheça muitos dos termos científicos usados pelos apresentadores. Usando o CLM do HAQM Transcribe, você pode treinar um modelo de linguagem personalizado para reconhecer os termos especializados usados em sua disciplina.

O CLM agora oferece permite alemão e japonês para transcrições em lote e de streaming e está disponível em todas as regiões da AWS nas quais o HAQM Transcribe opera. Para começar a criar seu próprio modelo de reconhecimento de voz personalizado, faça login no console de serviço do HAQM Transcribe. Para obter mais detalhes sobre o recurso CLM, consulte a publicação “Building custom language models to supercharge speech-to-text performance for HAQM Transcribe”. Você pode saber mais consultando a página de documentação do HAQM Transcribe.