Preço de Serviços Cognitivos – VISUALIZAÇÃO do Serviço de Fala Personalizado

Use as APIs de inteligência para habilitar capacidades de visão, fala, linguagem e conhecimento

O Serviço de Fala Personalizado permite que você crie modelos de reconhecimento de fala e implante-os em um ponto de extremidade de fala para texto que é ajustado para o seu aplicativo. Com o Serviço de Fala Personalizado, você pode personalizar o modelo de linguagem do reconhecedor de fala de modo que ele aprenda o vocabulário de seu aplicativo e o estilo de fala de seus usuários. Você também pode personalizar o modelo acústico do reconhecedor de fala para corresponder melhor ao ambiente e população de usuários esperados do aplicativo.

Detalhes de preços

A adaptação de modelo é gratuita.

Gratuito S1
Model Deployments 1 model $-/model/month
Model Adaptation 3 hours/month Unlimited
Testes de Precisão 2 hours/month 2 hours free and then $-/hour
Expansão N/D $-/unidade/dia, em que cada unidade permite que você envie cinco solicitações simultâneas
Sem rastreamento N/D $-/modelo/mês
Preço de solicitação 2 hours/month 2 hours free and then $-/hour

Suporte e Contrato de Nível de Serviço

  • Suporte gratuito para gerenciamento de cobrança e assinaturas
  • Precisa de assistência técnica para os serviços de visualização? Use nossos fóruns
  • Garantimos que os Serviços Cognitivos em execução na camada Padrão estarão disponíveis ao menos durante 99,9% do tempo. Nenhum SLA é fornecido para a camada Gratuita. Ler o SLA
  • Não há SLA durante o período de visualização. Saiba mais

Perguntas Frequentes

Serviço de Fala Personalizado

  • A camada 1 pode processar até quatro fragmentos de áudio (ou seja, quatro transcrições) simultaneamente e, ainda assim, responder em tempo real. Se o usuário enviar mais de quatro fragmentos simultâneos de áudio, cada fragmento subsequente de áudio será rejeitado e enviado de volta com um código de erro indicando excesso de reconhecimentos simultâneos. O mesmo se aplica à Camada 2, em que 12 transcrições simultâneas podem ser processadas. A Camada Gratuita oferece uma transcrição simultânea. Presume-se que o áudio será carregado em tempo real. Se o áudio for carregado mais rapidamente, para fins de simultaneidade, ainda se presumirá que a solicitação está em andamento até que a duração do áudio tenha transcorrido (embora o resultado do reconhecimento possa ser enviado de volta mais cedo).

    Observação: se um nível mais elevado de simultaneidade for necessário, contate-nos.

  • O modelo de linguagem é uma distribuição de probabilidade por sequências de palavras. O modelo de linguagem ajuda o sistema a decidir entre sequências de palavras que soam parecidas, com base na probabilidade das próprias sequências de palavras. Por exemplo, “reconhecer fala” e “amolecer bala” soam parecido, mas a primeira hipótese é muito mais provável de ocorrer e, portanto, terá atribuída a ela uma pontuação mais elevada pelo modelo de linguagem. Se você espera que consultas de voz para seu aplicativo contenham itens de vocabulário específicos, como nomes de produto ou jargões que raramente ocorrem na fala comum, é provável que você possa obter desempenho aprimorado personalizando o modelo de linguagem. Por exemplo, se você está compilando um aplicativo para pesquisar o MSDN por voz, é provável que termos como “orientado a objeto” ou “namespace” ou “dot net” apareçam com mais frequência do que em aplicativos de voz típicos. Personalizar o modelo de linguagem permitirá que o sistema aprenda isso.

  • O modelo acústico é um classificador que rotula fragmentos de áudio curtos em um de diversos fonemas ou unidades sonoras em cada linguagem. Esses fonemas podem então ser costurados para formar palavras. Por exemplo, a palavra “speech” é composta de quatro fonemas, “s p iy ch”. Essas classificações são feitas aproximadamente 100 vezes por segundo. Personalizar o modelo acústico pode permitir que o sistema aprenda a reconhecer melhor a fala em ambientes atípicos. Por exemplo, se você tiver um aplicativo projetado para ser usado por trabalhadores em um depósito ou fábrica, um modelo acústico personalizado poderá reconhecer fala de modo mais preciso na presença dos ruídos encontrados nesses ambientes.

  • O reconhecimento de Frase Curta dá suporte a declarações de até 15 segundos de duração. Quando usado com a biblioteca do Cliente de Fala, conforme os dados são enviados ao servidor, o cliente recebe vários resultados parciais e um resultado final com as múltiplas N melhores escolhas.

  • O reconhecimento de Ditado Longo dá suporte a declarações de até dois minutos de duração. Quando usado com a biblioteca do Cliente de Fala, conforme os dados são enviados ao servidor, o cliente recebe vários resultados parciais e vários resultados finais, com base nos pontos em que o servidor indica que estão as pausas nas sentenças.

  • Por exemplo, se um cliente utilizar a camada S1 para processar um milhão de transcrições, o preço da camada será cobrado dele ($-), as primeiras 100,000 transcrições serão cobradas a $- por 1,000 transcrições e as 900,000 transcrições restantes serão cobradas a $- por 1,000 transcrições. Portanto, na realidade, $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500 será cobrado do cliente.

  • Veja as informações sobre o Serviço de Fala Personalizado na página da Web dos Serviços Cognitivos da Microsoft e no site do Serviço de Fala Personalizado, www.cris.ai.

  • A implantação de modelos personalizados é o processo de encapsular um modelo personalizado e, em seguida, expô-lo como um serviço. O modelo personalizado implantado resultante expõe um ponto de extremidade através do qual ele pode ser acessado. Os usuários podem optar por implantar tantos modelos quantos precisarem.

  • O Serviço de Fala Personalizado permite que os usuários adaptem modelos de linha de base com base em seus próprios dados acústicos e de idioma. Chamamos esse processo de personalização de modelo.

  • Quando um modelo personalizado é criado, os usuários têm a opção de carregar dados de teste para avaliar o modelo recém-criado. Os usuários podem testar os novos modelos personalizados com tantos dados quantos forem necessários, ou seja, executar testes de precisão ilimitados.

  • Quando um modelo personalizado é implantado, o URI desse modelo pode processar uma solicitação de áudio por vez. Para cenários que enviam mais de uma solicitação de áudio simultaneamente para esse URI, os usuários podem optar por escalar horizontalmente a uma taxa de cinco solicitações simultâneas por vez. Isto é alcançado através da aquisição de unidades de escala. Cada unidade de escala garante até cinco solicitações simultâneas de áudio a um custo de $200 por unidade de escala. Por exemplo, se um usuário pretender atingir esse ponto de extremidade com 23 solicitações de áudio simultâneas, o usuário precisará comprar cinco unidades de escala para assegurar até 25 solicitações simultâneas.

  • O gerenciamento de log permite que os usuários desativem o registro em log para seus modelos implantados. Os usuários preocupados com a privacidade podem optar por desativar o registro em log de um modelo implantado a uma taxa de $20 por mês.

  • O preço de solicitação refere-se ao custo de processamento de solicitações de áudio pelo ponto de extremidade de um modelo personalizado implantado.

Geral

  • A API de Detecção de Emoções, a API de Detecção Facial, a API do Serviço Inteligente de Reconhecimento Vocal e a API de Conversão de Fala em Texto do Bing são cobradas por 1.000 chamadas de transação à API quando uma chamada à API de produção está sendo executada ativamente. A cobrança é dividida proporcionalmente em quantidades de chamadas de transação à API de produção.

    O serviço da API de Fala Contínua do Bing é cobrado por hora de fala analisada. A cobrança é dividida proporcionalmente por minuto.

    A API de Recomendações e a API de Análise de Texto podem ser adquiridas em unidades das camadas Standard por um preço fixo. Cada unidade de uma camada é fornecida com quantidades de transações de API incluídas. Se o usuário excede as quantidades incluídas, o excedente é cobrado de acordo com a tarifa especificada na tabela de preços acima. Esse excedente é dividido de maneira proporcional e o serviço é cobrado mensalmente. As quantidades incluídas em uma camada são reiniciadas a cada mês.

  • O uso ficará restrito se o limite de transações for atingido na Camada gratuita. Os clientes não poderão acumular excedentes na Camada gratuita.

  • Se o uso em uma camada Standard for excedido, a conta começará a acumular excedentes. Esses excedentes são cobrados mensalmente e calculados com a tarifa especificada para cada camada.

  • Qualquer chamada à API (com exceção das chamadas de pontuação de lote) contam como uma transação. As chamadas de pontuação de lote serão contadas com base no número de itens que precisam ser pontuados em uma transação.

  • O uso ficará restrito se o limite de transações for atingido na Camada gratuita. Os clientes não poderão acumular excedentes na Camada gratuita. Não há suporte para pontuação de lote na camada gratuita.

  • A API de Recomendações pode ser adquirida em unidades das camadas standard por um preço fixo. Cada unidade de uma camada é fornecida com quantidades de transações de API incluídas. Se o usuário excede as quantidades incluídas, o excedente é cobrado de acordo com a tarifa especificada na tabela de preços acima. Esse excedente é dividido de maneira proporcional e o serviço é cobrado mensalmente. As quantidades incluídas em uma camada são reiniciadas a cada mês.

  • As APIs de Pesquisa do Bing, a API de Sugestão Automática do Bing e a API de Verificador Ortográfico do Bing são cobradas mensalmente. Dependendo da camada comprada, haverá quantidades incluídas de transações definidas como chamadas à API. As quantidades incluídas sempre estarão ligadas ao mês calendário, independentemente do início do uso. Se o usuário exceder as quantidades incluídas, o excedente será cobrado de acordo com a tarifa especificada na tabela de preços. Esse excedente não é dividido de maneira proporcional e o serviço é cobrado mensalmente. As quantidades incluídas para cada camada são reiniciadas a cada mês.

  • Please visit the Cognitive Services subscription page to request free trials.

  • Você pode fazer a atualização para uma camada superior a qualquer momento. A tarifa de cobrança e as quantidades incluídas correspondentes à camada superior entrarão em vigor imediatamente.

Recursos

Calculadora

Faça a estimativa de seus custos mensais com os serviços do Azure

Perguntas frequentes sobre compra

Verifique as perguntas frequentes sobre preços do Azure

Detalhes do produto

Saiba mais sobre Serviços Cognitivos

Documentação

Consulte tutoriais técnicos, vídeos e outros recursos

Inscreva-se agora e ganhe $200 em créditos do Azure

Comece hoje mesmo