Preços dos Serviços Cognitivos - PRÉ-VISUALIZAÇÃO do Serviço de Voz Personalizada

Utilize as APIs de informações para ativar capacidades de visão, voz, linguagem e conhecimento.

O Serviço de Voz Personalizada permite-lhe criar modelos de reconhecimento de voz personalizada e implementá-los num ponto final de voz para texto adaptado para a sua aplicação. Com o Serviço de Voz Personalizada pode personalizar o modelo de idioma do reconhecedor de voz, para que este aprenda o vocabulário da sua aplicação e o estilo de fala dos seus utilizadores. Também pode personalizar o modelo acústico do reconhecedor de voz para melhor corresponder o ambiente esperado da aplicação e a população do utilizador.

Detalhes dos preços

A adaptação de modelos é gratuita.

Gratuito S1
Implementações de Modelos 1 modelo $-/modelo/mês
Adaptação de Modelos 3 horas/mês Ilimitado
Testes de Precisão 2 horas/mês 2 horas gratuitas e, posteriormente, $-/hora
Ampliar N/A $-/unidade/dia em que cada unidade permite enviar cinco pedidos simultâneos
Sem Rastreio N/A $-/modelo/mês
Preços de Pedidos 2 horas/mês 2 horas gratuitas e, posteriormente, $-/hora

Suporte e SLA

  • A faturação gratuita e apoio à gestão da subscrição estão incluídas.
  • Necessita de suporte técnico para serviços de pré-visualização? Utilize os nossos fóruns.
  • Garantimos que os Serviços Cognitivos em execução no escalão Standard estarão disponíveis, pelo menos, 99,9% do tempo. Não é fornecido SLA para o escalão gratuito. Ler o SLA
  • Nenhum SLA durante o período de pré-visualização. Saiba mais.

FAQ

Serviço de Voz Personalizada

  • O escalão 1 pode processar até quatro peças de áudio (por exemplo, quatro transcrições) ao mesmo tempo e continuar a responder em tempo real. Se o utilizador enviar mais de quatro peças de áudio em simultâneo, cada peça de áudio subsequente é rejeitada e enviada de volta com um código de erro, indicando muitos reconhecimentos simultâneos. O mesmo aplica-se ao Escalão 2, onde podem ser processadas 12 transcrições simultâneas. O Escalão gratuito oferece uma transcrição simultânea. É assumido que o áudio será carregado em tempo real. Se o áudio for carregado mais rapidamente, para fins de simultaneidade o pedido continuará a ser assumido como sendo contínuo até que a duração do áudio tenha passado (apesar de o resultado do reconhecimento poder ser enviado de volta mais cedo).

    Nota: se for necessário o nível mais elevado de simultaneidade, contacte-nos.

  • O modelo de idioma é uma distribuição de probabilidade sobre sequências de palavras. O modelo de idioma ajuda o sistema a decidir entre sequências de palavras que soam de forma semelhante, com base na probabilidade das próprias sequências de palavras. Por exemplo, “recognize speech” e “wreck a nice beach” soam de forma parecida, mas a primeira hipótese é muito mais provável de ocorrer e, portanto, será atribuída uma melhor classificação pelo modelo do idioma. Se espera que as consultas de voz na sua aplicação contenham itens de vocabulário particulares, como nomes de produtos ou gíria, que ocorrem raramente no discurso habitual, é provável que consiga obter um melhor desempenho ao personalizar o modelo de idioma. Por exemplo, se estava a criar uma aplicação para pesquisar o MSDN por voz, é provável que termos como “orientado por objetos” ou “espaço de nomes” ou “ponto net” apareçam com mais frequência do que em aplicações de discurso habitual. A personalização do modelo de idioma irá permitir que o sistema aprenda isto.

  • O modelo acústico é um classificador que rotula fragmentos curtos de áudio num de vários fonemas, ou unidades de som, em cada idioma. Estes fonemas podem ser unidos para formar palavras. Por exemplo, a palavra “speech” é constituída por quatro fonemas “s p iy ch”. Estas classificações são feitas na ordem de 100 vezes por segundo. A personalização do modelo acústico pode permitir que o sistema aprenda a melhorar o reconhecimento de voz em ambientes atípicos. Por exemplo, se tem uma aplicação concebida para ser utilizada por trabalhadores num armazém ou numa fábrica, um modelo acústico personalizado pode reconhecer com mais precisão a voz na presença dos ruídos encontrados nestes ambientes.

  • O reconhecimento de Frase Curta suporta discursos de até 15 segundos de duração. Quanto utilizado com a biblioteca de Cliente de Voz, enquanto os dados são enviados para o servidor, o cliente irá receber vários resultados parciais e um resultado de escolha múltipla.

  • O reconhecimento de Ditado Contínuo suporta discursos de até dois minutos de duração. Quando utilizado com a biblioteca de Cliente de Voz, enquanto os dados são enviados para o servidor, o cliente irá receber vários resultados parciais e finais, com base onde o servidor indica as pausas das frases.

  • Por exemplo, se um cliente utilizar o escalão S1 para processar um milhão de transcrições, ser-lhe-á cobrado o preço de escalão ($-), as primeiras 100,000 transcrições são cobradas a $- por 1,000 transcrições e as restantes 900,000 transcrições são cobradas a $- por 1,000 transcrições. Então, nesta base, é cobrado $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500 ao cliente.

  • Consulte as informações do Serviço Voz Personalizada na página Web dos Serviços Cognitivos da Microsoft e no Web site do Serviço de Voz Personalizada, www.cris.ai.

  • A implementação do modelo personalizado é o processo de criação de um modelo personalizado e, em seguida, expô-lo como serviço. O modelo personalizado implementado resultante expõe um ponto final através do qual pode ser acedido. Os utilizadores podem optar por implementar o número de modelos necessário.

  • O Serviço de Voz Personalizada permite aos utilizadores adaptar modelos de base baseados nos seus próprios dados de acústica e idioma. Isto é denominado personalização do modelo de processo.

  • Quando é criado um modelo personalizado, os utilizadores podem carregar dados de teste para avaliar o modelo criado recentemente. Os utilizadores podem testar os novos modelos personalizados com a quantidade de dados necessária, ou seja, através da execução de testes de precisão ilimitados.

  • Quando tiver sido implementado um modelo personalizado, o respetivo URI pode processar um pedido de áudio de cada vez. Para cenários em que sejam enviados mais do que um pedido de áudio em simultâneo para o URI, os utilizadores podem optar por aumentar horizontalmente a uma taxa de cinco pedidos em simultâneo. Isto é conseguido ao comprar unidades de escala. Cada unidade de escala garante até cinco pedidos de áudio em simultâneo a um custo de $200 por unidade de escala. Por exemplo, se um utilizador quiser enviar 23 pedidos de áudio para um ponto final ao mesmo tempo, o utilizador terá de comprar cinco unidades de escala para garantir até 25 pedidos simultâneos.

  • A gestão de registos permite aos utilizadores desativar o registo dos modelos implementados. Os utilizadores preocupados com a privacidade podem optar por desativar o registo de um modelo implementado a uma taxa de $20 por mês.

  • Os preços de pedidos referem-se ao custo de processamento de pedidos de áudio do ponto final de um modelo personalizado implementado.

Geral

  • A API de Emoções, a API Face, a API de Serviço Inteligente de Compreensão de Idiomas, a API de Reconhecimento de Voz Ditada Breve do Bing e a API de Voz em Texto do Bing são cobradas por cada 1 000 chamadas de transação de API quando uma chamada à API de produção está a ser ativamente executada. A faturação é calculada para quantidades de chamadas de transação à API de produção.

    O serviço da API de Reconhecimento de Voz Ditada Contínua do Bing é cobrado por hora de discurso analisado. A faturação é rateada ao minuto.

    A API de Recomendações e a API de Análise de Texto podem ser adquiridas em unidades dos escalões standard a um preço fixo. Cada unidade de um escalão vem com quantidades incluídas de transações de API. Se o utilizador exceder as quantidades incluídas, os excedentes são cobrados às taxas especificadas na tabela de preços acima. Estas utilizações excedidas são rateadas e o serviço é cobrado mensalmente. As quantidades incluídas num escalão são repostas todos os meses.

  • A utilização é limitada se o limite da transação for alcançado no escalão gratuito. Os clientes não podem acumular excedentes no escalão gratuito.

  • Qualquer anotação num documento conta como uma transação. As chamadas de classificação de batch também considerarão o número de documentos que devem ser classificados nessa transação. Por exemplo, se forem enviados 1 000 documentos para análise de sentimentos numa única chamada à API, são contabilizadas 1 000 transações. Se uma API suportar mais do que uma operação de anotação, isso também será considerado. Vamos supor que uma chamada à API efetua análise de sentimentos e extração de frases-chave em 1 000 documentos, o que irá contar para 2 000 transações (2 anotações * 1 000 documentos).

  • Se a utilização de um escalão standard for excedida, a conta começa a limitar as utilizações excedidas. Estas utilizações excedidas são cobradas mensalmente e calculadas consoante a taxa especificada para cada escalão.

  • Qualquer chamada à API (com a exceção das chamadas de classificação de batch) contam como uma transação. As chamadas de classificação de batch serão contadas com base no número de itens que necessitam de ser classificados nessa transação.

  • A utilização é limitada se o limite da transação for alcançado no escalão gratuito. Os clientes não podem acumular excedentes no escalão gratuito. A classificação de batch não é suportada no escalão gratuito.

  • A API de Recomendações pode ser adquirida em unidades dos escalões standard a um preço fixo. Cada unidade de um escalão vem com quantidades incluídas de transações de API. Se o utilizador exceder as quantidades incluídas, os excedentes são cobrados às taxas especificadas na tabela de preços acima. Estas utilizações excedidas são rateadas e o serviço é cobrado mensalmente. As quantidades incluídas num escalão são repostas todos os meses.

  • Pode atualizar para um escalão mais elevado em qualquer altura. A taxa de faturação e as quantidades incluídas correspondentes ao escalão mais elevado serão iniciadas imediatamente.

Recursos

Calcule o custo mensal dos serviços Azure

Reveja as perguntas mais frequentes sobre os preços do Azure

Obter mais informações sobre Serviços Cognitivos

Reveja tutoriais técnicos, vídeos e outros recursos

Adicionar à estimativa. Prima "v" para ver na calculadora Ver na calculadora

Aprender e criar com um crédito de $200, e continuar gratuitamente

Conta gratuita