Preço de Serviços Cognitivos – VISUALIZAÇÃO do Serviço de Fala Personalizado

Use as APIs de inteligência para habilitar capacidades de visão, fala, linguagem e conhecimento

O Serviço de Fala Personalizado permite que você crie modelos de reconhecimento de fala e implante-os em um ponto de extremidade de fala para texto que é ajustado para o seu aplicativo. Com o Serviço de Fala Personalizado, você pode personalizar o modelo de linguagem do reconhecedor de fala de modo que ele aprenda o vocabulário de seu aplicativo e o estilo de fala de seus usuários. Você também pode personalizar o modelo acústico do reconhecedor de fala para corresponder melhor ao ambiente e população de usuários esperados do aplicativo.

Detalhes de preços

A adaptação de modelo é gratuita.

Gratuito S2
Implantações de Modelo Modelo 1 $-/modelo/mês
Adaptação de Modelo 3 horas/mês Ilimitado
Testes de Precisão 2 horas/mês 2 horas gratuitas e, depois, $-/hora
Expansão N/D $-/unidade/dia, em que cada unidade permite que você envie cinco solicitações simultâneas
Sem rastreamento N/D $-/modelo/mês
Preço de solicitação 2 horas/mês 2 horas gratuitas e, depois, $-/hora

Suporte e Contrato de Nível de Serviço

  • Suporte gratuito para gerenciamento de cobrança e assinaturas está incluso.
  • Precisa de assistência técnica para os serviços de visualização? Use nossos fóruns.
  • Garantimos que os Serviços Cognitivos em execução na camada Standard estarão disponíveis durante, pelo menos, 99,9% do tempo. Nenhum SLA é fornecido para a camada gratuita. Leia o SLA.
  • Não há SLA durante o período de visualização. Saiba mais.

Perguntas Frequentes

Serviço de Fala Personalizado

  • A camada 1 pode processar até quatro fragmentos de áudio (ou seja, quatro transcrições) simultaneamente e, ainda assim, responder em tempo real. Se o usuário enviar mais de quatro fragmentos simultâneos de áudio, cada fragmento subsequente de áudio será rejeitado e enviado de volta com um código de erro indicando excesso de reconhecimentos simultâneos. O mesmo se aplica à Camada 2, em que 12 transcrições simultâneas podem ser processadas. A Camada Gratuita oferece uma transcrição simultânea. Presume-se que o áudio será carregado em tempo real. Se o áudio for carregado mais rapidamente, para fins de simultaneidade, ainda se presumirá que a solicitação está em andamento até que a duração do áudio tenha transcorrido (embora o resultado do reconhecimento possa ser enviado de volta mais cedo).

    Observação: se um nível mais elevado de simultaneidade for necessário, contate-nos.

  • O modelo de linguagem é uma distribuição de probabilidade por sequências de palavras. O modelo de linguagem ajuda o sistema a decidir entre sequências de palavras que soam parecidas, com base na probabilidade das próprias sequências de palavras. Por exemplo, “reconhecer fala” e “amolecer bala” soam parecido, mas a primeira hipótese é muito mais provável de ocorrer e, portanto, terá atribuída a ela uma pontuação mais elevada pelo modelo de linguagem. Se você espera que consultas de voz para seu aplicativo contenham itens de vocabulário específicos, como nomes de produto ou jargões que raramente ocorrem na fala comum, é provável que você possa obter desempenho aprimorado personalizando o modelo de linguagem. Por exemplo, se você está compilando um aplicativo para pesquisar o MSDN por voz, é provável que termos como “orientado a objeto” ou “namespace” ou “dot net” apareçam com mais frequência do que em aplicativos de voz típicos. Personalizar o modelo de linguagem permitirá que o sistema aprenda isso.

  • O modelo acústico é um classificador que rotula fragmentos de áudio curtos em um de diversos fonemas ou unidades sonoras em cada linguagem. Esses fonemas podem então ser costurados para formar palavras. Por exemplo, a palavra “speech” é composta de quatro fonemas, “s p iy ch”. Essas classificações são feitas aproximadamente 100 vezes por segundo. Personalizar o modelo acústico pode permitir que o sistema aprenda a reconhecer melhor a fala em ambientes atípicos. Por exemplo, se você tiver um aplicativo projetado para ser usado por trabalhadores em um depósito ou fábrica, um modelo acústico personalizado poderá reconhecer fala de modo mais preciso na presença dos ruídos encontrados nesses ambientes.

  • O reconhecimento de Frase Curta dá suporte a declarações de até 15 segundos de duração. Quando usado com a biblioteca do Cliente de Fala, conforme os dados são enviados ao servidor, o cliente recebe vários resultados parciais e um resultado final com as múltiplas N melhores escolhas.

  • O reconhecimento de Ditado Longo dá suporte a declarações de até dois minutos de duração. Quando usado com a biblioteca do Cliente de Fala, conforme os dados são enviados ao servidor, o cliente recebe vários resultados parciais e vários resultados finais, com base nos pontos em que o servidor indica que estão as pausas nas sentenças.

  • Por exemplo, se um cliente utilizar a camada S1 para processar um milhão de transcrições, o preço da camada será cobrado dele ($-), as primeiras 100,000 transcrições serão cobradas a $- por 1,000 transcrições e as 900,000 transcrições restantes serão cobradas a $- por 1,000 transcrições. Portanto, na realidade, $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500 será cobrado do cliente.

  • Veja as informações sobre o Serviço de Fala Personalizado na página da Web dos Serviços Cognitivos da Microsoft e no site do Serviço de Fala Personalizado, www.cris.ai.

  • A implantação de modelos personalizados é o processo de encapsular um modelo personalizado e, em seguida, expô-lo como um serviço. O modelo personalizado implantado resultante expõe um ponto de extremidade através do qual ele pode ser acessado. Os usuários podem optar por implantar tantos modelos quantos precisarem.

  • O Serviço de Fala Personalizado permite que os usuários adaptem modelos de linha de base com base em seus próprios dados acústicos e de idioma. Chamamos esse processo de personalização de modelo.

  • Quando um modelo personalizado é criado, os usuários têm a opção de carregar dados de teste para avaliar o modelo recém-criado. Os usuários podem testar os novos modelos personalizados com tantos dados quantos forem necessários, ou seja, executar testes de precisão ilimitados.

  • Quando um modelo personalizado é implantado, o URI desse modelo pode processar uma solicitação de áudio por vez. Para cenários que enviam mais de uma solicitação de áudio simultaneamente para esse URI, os usuários podem optar por escalar horizontalmente a uma taxa de cinco solicitações simultâneas por vez. Isto é alcançado através da aquisição de unidades de escala. Cada unidade de escala garante até cinco solicitações simultâneas de áudio a um custo de $200 por unidade de escala. Por exemplo, se um usuário pretender atingir esse ponto de extremidade com 23 solicitações de áudio simultâneas, o usuário precisará comprar cinco unidades de escala para assegurar até 25 solicitações simultâneas.

  • O gerenciamento de log permite que os usuários desativem o registro em log para seus modelos implantados. Os usuários preocupados com a privacidade podem optar por desativar o registro em log de um modelo implantado a uma taxa de $20 por mês.

  • O preço de solicitação refere-se ao custo de processamento de solicitações de áudio pelo ponto de extremidade de um modelo personalizado implantado.

Geral

  • A API de Detecção de Emoções, a API de Detecção Facial, a API do Serviço Inteligente de Reconhecimento Vocal, a API de Conversão de Texto em Fala do Bing e a API de Conversão de Fala em Texto do Bing são cobradas por 1.000 transações de chamadas à API quando uma chamada à API de produção está sendo executada ativamente. A cobrança é dividida proporcionalmente em quantidades de chamadas de transação à API de produção.

    O serviço da API de Fala Contínua do Bing é cobrado por hora de fala analisada. A cobrança é dividida proporcionalmente por minuto.

    A API de Recomendações e a API de Análise de Texto podem ser adquiridas em unidades das camadas Standard por um preço fixo. Cada unidade de uma camada é fornecida com quantidades de transações de API incluídas. Se o usuário excede as quantidades incluídas, o excedente é cobrado de acordo com a tarifa especificada na tabela de preços acima. Esse excedente é dividido de maneira proporcional e o serviço é cobrado mensalmente. As quantidades incluídas em uma camada são reiniciadas a cada mês.

  • O uso ficará restrito se o limite de transações for atingido na camada gratuita. Os clientes não poderão acumular excedentes na Camada gratuita.

  • Qualquer anotação em um documento conta como uma transação. As chamadas de pontuação do Lote também levarão em consideração o número de documentos que precisam ser pontuados na transação. Por exemplo, se 1.000 documentos forem enviados para a análise de sentimento em uma única chamada à API, isso contará como 1.000 transações. Se uma API der suporte a mais de uma operação de anotação, isso também será considerado. Imagine que uma chamada à API execute a análise de sentimento e a extração de frases-chave em 1.000 documentos, isso contará como 2.000 transações (duas anotações *1.000 documentos).

  • Se o uso em uma camada Standard for excedido, a conta começará a acumular excedentes. Esses excedentes são cobrados mensalmente e calculados com a taxa especificada para cada camada.

  • Qualquer chamada à API (com exceção das chamadas de pontuação de lote) contam como uma transação. As chamadas de pontuação de lote serão contadas com base no número de itens que precisam ser pontuados em uma transação.

  • O uso ficará restrito se o limite de transações for atingido na camada gratuita. Os clientes não poderão acumular excedentes na Camada gratuita. Não há suporte para pontuação de lote na camada gratuita.

  • A API de Recomendações pode ser adquirida em unidades das camadas standard por um preço fixo. Cada unidade de uma camada é fornecida com quantidades de transações de API incluídas. Se o usuário excede as quantidades incluídas, o excedente é cobrado de acordo com a tarifa especificada na tabela de preços acima. Esse excedente é dividido de maneira proporcional e o serviço é cobrado mensalmente. As quantidades incluídas em uma camada são reiniciadas a cada mês.

  • Você pode fazer a atualização para uma camada superior a qualquer momento. A tarifa de cobrança e as quantidades incluídas correspondentes à camada superior entrarão em vigor imediatamente.

Recursos

Faça a estimativa de seus custos mensais com os serviços do Azure

Verifique as perguntas frequentes sobre preços do Azure

Saiba mais sobre Serviços Cognitivos

Consulte tutoriais técnicos, vídeos e outros recursos

Adicionado à estimativa. Pressione ‘v’ para exibir na calculadora Exibir na calculadora

Aprenda e crie com $200 de crédito e continue gratuitamente

Conta gratuita