Ignorar Navegação

Preços dos Serviços Cognitivos - PRÉ-VISUALIZAÇÃO do Serviço de Voz Personalizada

Utilize as APIs de informações para ativar capacidades de visão, voz, linguagem e conhecimento.

O Serviço de Voz Personalizada permite-lhe criar modelos de reconhecimento de voz personalizada e implementá-los num ponto final de voz para texto adaptado para a sua aplicação. Com o Serviço de Voz Personalizada pode personalizar o modelo de idioma do reconhecedor de voz, para que este aprenda o vocabulário da sua aplicação e o estilo de fala dos seus utilizadores. Também pode personalizar o modelo acústico do reconhecedor de voz para melhor corresponder o ambiente esperado da aplicação e a população do utilizador.

Detalhes dos preços

A adaptação de modelos é gratuita.

Gratuito S2
Implementações de Modelos 1 modelo $-/modelo/mês
Adaptação de Modelos 3 horas/mês Ilimitado
Testes de Precisão 2 horas/mês 2 horas gratuitas e, posteriormente, $-/hora
Ampliar N/A $-/unidade/dia em que cada unidade permite enviar cinco pedidos simultâneos
Sem Rastreio N/A $-/modelo/mês
Preços de Pedidos 2 horas/mês 2 horas gratuitas e, posteriormente, $-/hora

Suporte e SLA

  • A faturação gratuita e apoio à gestão da subscrição estão incluídas.
  • Necessita de suporte técnico para serviços de pré-visualização? Utilize os nossos fóruns.
  • Garantimos que os Serviços Cognitivos em execução no escalão standard estarão disponíveis, pelo menos, 99,9% do tempo. Não é fornecido um SLA para a avaliação gratuita. Ler o SLA
  • Nenhum SLA durante o período de pré-visualização. Saiba mais.

FAQ

Serviço de Voz Personalizada

  • O escalão 1 pode processar até quatro peças de áudio (por exemplo, quatro transcrições) ao mesmo tempo e continuar a responder em tempo real. Se o utilizador enviar mais de quatro peças de áudio em simultâneo, cada peça de áudio subsequente é rejeitada e enviada de volta com um código de erro, indicando muitos reconhecimentos simultâneos. O mesmo aplica-se ao Escalão 2, onde podem ser processadas 12 transcrições simultâneas. O Escalão gratuito oferece uma transcrição simultânea. É assumido que o áudio será carregado em tempo real. Se o áudio for carregado mais rapidamente, para fins de simultaneidade o pedido continuará a ser assumido como sendo contínuo até que a duração do áudio tenha passado (apesar de o resultado do reconhecimento poder ser enviado de volta mais cedo).

    Nota: se for necessário o nível mais elevado de simultaneidade, contacte-nos.

  • O modelo de idioma é uma distribuição de probabilidade sobre sequências de palavras. O modelo de idioma ajuda o sistema a decidir entre sequências de palavras que soam de forma semelhante, com base na probabilidade das próprias sequências de palavras. Por exemplo, “recognize speech” e “wreck a nice beach” soam de forma parecida, mas a primeira hipótese é muito mais provável de ocorrer e, portanto, será atribuída uma melhor classificação pelo modelo do idioma. Se espera que as consultas de voz na sua aplicação contenham itens de vocabulário particulares, como nomes de produtos ou gíria, que ocorrem raramente no discurso habitual, é provável que consiga obter um melhor desempenho ao personalizar o modelo de idioma. Por exemplo, se estava a criar uma aplicação para pesquisar o MSDN por voz, é provável que termos como “orientado por objetos” ou “espaço de nomes” ou “ponto net” apareçam com mais frequência do que em aplicações de discurso habitual. A personalização do modelo de idioma irá permitir que o sistema aprenda isto.

  • O modelo acústico é um classificador que rotula fragmentos curtos de áudio num de vários fonemas, ou unidades de som, em cada idioma. Estes fonemas podem ser unidos para formar palavras. Por exemplo, a palavra “speech” é constituída por quatro fonemas “s p iy ch”. Estas classificações são feitas na ordem de 100 vezes por segundo. A personalização do modelo acústico pode permitir que o sistema aprenda a melhorar o reconhecimento de voz em ambientes atípicos. Por exemplo, se tem uma aplicação concebida para ser utilizada por trabalhadores num armazém ou numa fábrica, um modelo acústico personalizado pode reconhecer com mais precisão a voz na presença dos ruídos encontrados nestes ambientes.

  • O reconhecimento de Frase Curta suporta discursos de até 15 segundos de duração. Quanto utilizado com a biblioteca de Cliente de Voz, enquanto os dados são enviados para o servidor, o cliente irá receber vários resultados parciais e um resultado de escolha múltipla.

  • O reconhecimento de Ditado Contínuo suporta discursos de até dois minutos de duração. Quando utilizado com a biblioteca de Cliente de Voz, enquanto os dados são enviados para o servidor, o cliente irá receber vários resultados parciais e finais, com base onde o servidor indica as pausas das frases.

  • Por exemplo, se um cliente utilizar o escalão S1 para processar um milhão de transcrições, ser-lhe-á cobrado o preço de escalão ($-), as primeiras 100,000 transcrições são cobradas a $- por 1,000 transcrições e as restantes 900,000 transcrições são cobradas a $- por 1,000 transcrições. Então, nesta base, é cobrado $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500 ao cliente.

  • Consulte as informações do Serviço Voz Personalizada na página Web dos Serviços Cognitivos da Microsoft e no Web site do Serviço de Voz Personalizada, www.cris.ai.

  • A implementação do modelo personalizado é o processo de criação de um modelo personalizado e, em seguida, expô-lo como serviço. O modelo personalizado implementado resultante expõe um ponto final através do qual pode ser acedido. Os utilizadores podem optar por implementar o número de modelos necessário.

  • O Serviço de Voz Personalizada permite aos utilizadores adaptar modelos de base baseados nos seus próprios dados de acústica e idioma. Isto é denominado personalização do modelo de processo.

  • Quando é criado um modelo personalizado, os utilizadores podem carregar dados de teste para avaliar o modelo criado recentemente. Os utilizadores podem testar os novos modelos personalizados com a quantidade de dados necessária, ou seja, através da execução de testes de precisão ilimitados.

  • Quando tiver sido implementado um modelo personalizado, o respetivo URI pode processar um pedido de áudio de cada vez. Para cenários em que sejam enviados mais do que um pedido de áudio em simultâneo para o URI, os utilizadores podem optar por aumentar horizontalmente a uma taxa de cinco pedidos em simultâneo. Isto é conseguido ao comprar unidades de escala. Cada unidade de escala garante até cinco pedidos de áudio em simultâneo a um custo de $200 por unidade de escala. Por exemplo, se um utilizador quiser enviar 23 pedidos de áudio para um ponto final ao mesmo tempo, o utilizador terá de comprar cinco unidades de escala para garantir até 25 pedidos simultâneos.

  • A gestão de registos permite aos utilizadores desativar o registo dos modelos implementados. Os utilizadores preocupados com a privacidade podem optar por desativar o registo de um modelo implementado a uma taxa de $20 por mês.

  • Os preços de pedidos referem-se ao custo de processamento de pedidos de áudio do ponto final de um modelo personalizado implementado.

Geral

  • As APIs de Pesquisa do Bing são faturadas com base no número de transações (também conhecidas como chamadas à API). Estes planos são pay as you go e não implicam custos adicionais para consultas complexas e mais de 10 resultados (até 50 resultados, na maioria dos casos).

  • Se exceder o número indicado de transações por segundo (TPS), a sua utilização será limitada de forma a ficar dentro do limite referido. Se a sua aplicação precisar de um TPS mais elevado do que os referidos nesta página, contacte a equipa de suporte do Azure.

  • Para efeitos de faturação, uma transação é um pedido de chamada à API do Bing (embora existam advertências para ataques DoS). Para efeitos de registo e relatórios, como o Suplemento de Estatísticas do Bing, uma transação é qualquer chamada à API do Bing, independentemente de ser realizada com êxito.

  • Pode alterar o escalão do serviço a qualquer momento. Certifique-se de que utiliza as chaves adequadas nas chamadas à API. Se tiver um Contrato Enterprise com a Microsoft, trabalhe com o seu executivo de conta.

Recursos

Calcule o custo mensal dos serviços Azure

Reveja as perguntas mais frequentes sobre os preços do Azure

Saiba mais sobre Serviços Cognitivos

Reveja tutoriais técnicos, vídeos e outros recursos

Adicionar à estimativa. Prima "v" para ver na calculadora Ver na calculadora

Aprender e criar com um crédito de $200, e continuar gratuitamente