Ignorar navegação

Preço de Serviços Cognitivos – VISUALIZAÇÃO do Serviço de Fala Personalizado

Use as APIs de inteligência para habilitar capacidades de visão, fala, linguagem e conhecimento

O Serviço de Fala Personalizado permite que você crie modelos de reconhecimento de fala e implante-os em um ponto de extremidade de fala para texto que é ajustado para o seu aplicativo. Com o Serviço de Fala Personalizado, você pode personalizar o modelo de linguagem do reconhecedor de fala de modo que ele aprenda o vocabulário de seu aplicativo e o estilo de fala de seus usuários. Você também pode personalizar o modelo acústico do reconhecedor de fala para corresponder melhor ao ambiente e população de usuários esperados do aplicativo.

Detalhes de preços

A adaptação de modelo é gratuita.

Gratuito S2
Implantações de Modelo Modelo 1 $-/modelo/mês
Adaptação de Modelo 3 horas/mês Ilimitado
Testes de Precisão 2 horas/mês 2 horas gratuitas e, depois, $-/hora
Expansão N/D $-/unidade/dia, em que cada unidade permite que você envie cinco solicitações simultâneas
Sem rastreamento N/D $-/modelo/mês
Preço de solicitação 2 horas/mês 2 horas gratuitas e, depois, $-/hora

Suporte e SLA (Contrato de Nível de Serviço)

  • Suporte gratuito para gerenciamento de cobrança e assinaturas está incluso.
  • Precisa de assistência técnica para os serviços de visualização? Use nossos fóruns.
  • Garantimos que os Serviços Cognitivos em execução na camada Standard estarão disponíveis durante, pelo menos, 99,9% do tempo. Nenhum SLA é fornecido para a camada gratuita. Leia o SLA.
  • Não há SLA durante o período de visualização. Saiba mais.

Perguntas Frequentes

Serviço de Fala Personalizado

  • A camada 1 pode processar até quatro fragmentos de áudio (ou seja, quatro transcrições) simultaneamente e, ainda assim, responder em tempo real. Se o usuário enviar mais de quatro fragmentos simultâneos de áudio, cada fragmento subsequente de áudio será rejeitado e enviado de volta com um código de erro indicando excesso de reconhecimentos simultâneos. O mesmo se aplica à Camada 2, em que 12 transcrições simultâneas podem ser processadas. A Camada Gratuita oferece uma transcrição simultânea. Presume-se que o áudio será carregado em tempo real. Se o áudio for carregado mais rapidamente, para fins de simultaneidade, ainda se presumirá que a solicitação está em andamento até que a duração do áudio tenha transcorrido (embora o resultado do reconhecimento possa ser enviado de volta mais cedo).

    Observação: se um nível mais elevado de simultaneidade for necessário, contate-nos.

  • O modelo de linguagem é uma distribuição de probabilidade por sequências de palavras. O modelo de linguagem ajuda o sistema a decidir entre sequências de palavras que soam parecidas, com base na probabilidade das próprias sequências de palavras. Por exemplo, “reconhecer fala” e “amolecer bala” soam parecido, mas a primeira hipótese é muito mais provável de ocorrer e, portanto, terá atribuída a ela uma pontuação mais elevada pelo modelo de linguagem. Se você espera que consultas de voz para seu aplicativo contenham itens de vocabulário específicos, como nomes de produto ou jargões que raramente ocorrem na fala comum, é provável que você possa obter desempenho aprimorado personalizando o modelo de linguagem. Por exemplo, se você está compilando um aplicativo para pesquisar o MSDN por voz, é provável que termos como “orientado a objeto” ou “namespace” ou “dot net” apareçam com mais frequência do que em aplicativos de voz típicos. Personalizar o modelo de linguagem permitirá que o sistema aprenda isso.

  • O modelo acústico é um classificador que rotula fragmentos de áudio curtos em um de diversos fonemas ou unidades sonoras em cada linguagem. Esses fonemas podem então ser costurados para formar palavras. Por exemplo, a palavra “speech” é composta de quatro fonemas, “s p iy ch”. Essas classificações são feitas aproximadamente 100 vezes por segundo. Personalizar o modelo acústico pode permitir que o sistema aprenda a reconhecer melhor a fala em ambientes atípicos. Por exemplo, se você tiver um aplicativo projetado para ser usado por trabalhadores em um depósito ou fábrica, um modelo acústico personalizado poderá reconhecer fala de modo mais preciso na presença dos ruídos encontrados nesses ambientes.

  • O reconhecimento de Frase Curta dá suporte a declarações de até 15 segundos de duração. Quando usado com a biblioteca do Cliente de Fala, conforme os dados são enviados ao servidor, o cliente recebe vários resultados parciais e um resultado final com as múltiplas N melhores escolhas.

  • O reconhecimento de Ditado Longo dá suporte a declarações de até dois minutos de duração. Quando usado com a biblioteca do Cliente de Fala, conforme os dados são enviados ao servidor, o cliente recebe vários resultados parciais e vários resultados finais, com base nos pontos em que o servidor indica que estão as pausas nas sentenças.

  • Por exemplo, se um cliente utilizar a camada S1 para processar um milhão de transcrições, o preço da camada será cobrado dele ($-), as primeiras 100,000 transcrições serão cobradas a $- por 1,000 transcrições e as 900,000 transcrições restantes serão cobradas a $- por 1,000 transcrições. Portanto, na realidade, $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500 será cobrado do cliente.

  • Veja as informações sobre o Serviço de Fala Personalizado na página da Web dos Serviços Cognitivos da Microsoft e no site do Serviço de Fala Personalizado, www.cris.ai.

  • A implantação de modelos personalizados é o processo de encapsular um modelo personalizado e, em seguida, expô-lo como um serviço. O modelo personalizado implantado resultante expõe um ponto de extremidade através do qual ele pode ser acessado. Os usuários podem optar por implantar tantos modelos quantos precisarem.

  • O Serviço de Fala Personalizado permite que os usuários adaptem modelos de linha de base com base em seus próprios dados acústicos e de idioma. Chamamos esse processo de personalização de modelo.

  • Quando um modelo personalizado é criado, os usuários têm a opção de carregar dados de teste para avaliar o modelo recém-criado. Os usuários podem testar os novos modelos personalizados com tantos dados quantos forem necessários, ou seja, executar testes de precisão ilimitados.

  • Quando um modelo personalizado é implantado, o URI desse modelo pode processar uma solicitação de áudio por vez. Para cenários que enviam mais de uma solicitação de áudio simultaneamente para esse URI, os usuários podem optar por escalar horizontalmente a uma taxa de cinco solicitações simultâneas por vez. Isto é alcançado através da aquisição de unidades de escala. Cada unidade de escala garante até cinco solicitações simultâneas de áudio a um custo de $200 por unidade de escala. Por exemplo, se um usuário pretender atingir esse ponto de extremidade com 23 solicitações de áudio simultâneas, o usuário precisará comprar cinco unidades de escala para assegurar até 25 solicitações simultâneas.

  • O gerenciamento de log permite que os usuários desativem o registro em log para seus modelos implantados. Os usuários preocupados com a privacidade podem optar por desativar o registro em log de um modelo implantado a uma taxa de $20 por mês.

  • O preço de solicitação refere-se ao custo de processamento de solicitações de áudio pelo ponto de extremidade de um modelo personalizado implantado.

Geral

  • Bing Search APIs are invoiced based on number of transactions (also known as API calls). These plans are pay-as-you-go and doesn’t incur additional cost for complex queries and more than 10 results (up to 50 results in most cases).

  • If you happen to exceed the mentioned number of transactions per second (TPS), your usage will be throttled to be within the mentioned limit. If your application needs to have higher TPS than the ones mentioned on this page, please reach out to the Azure support team.

  • For billing purposes, a transaction is a successful Bing API call request (though there are caveats for DoS attacks). For logging and reporting purposes such as for the Bing Statistics Add-in, it is any Bing API call irrespective of whether it is successful or not.

  • You can change the tier of service anytime. Please make sure you use appropriate keys in your API calls. If you are having enterprise agreement with Microsoft, please work with your account executive.

Recursos

Faça a estimativa de seus custos mensais com os serviços do Azure

Verifique as perguntas frequentes sobre preços do Azure

Saiba mais sobre Serviços Cognitivos

Consulte tutoriais técnicos, vídeos e outros recursos

Adicionado à estimativa. Pressione ‘v’ para exibir na calculadora Exibir na calculadora

Aprenda e crie com $200 de crédito e continue gratuitamente