认知服务定价 - 自定义语音服务 预览

使用智能 API 以启用影像、语音、语言和知识功能

自定义语音服务让用户能够创建自定义语音识别模型并将其部署到适用于用户应用程序的语音到文本终结点。借助自定义语音服务,可以自定义语音识别器的语言模型,使其掌握应用程序的词汇和用户的说话风格。还可以自定义语音识别器的声学模型,使其更好地匹配应用程序的预期环境和用户群体。

定价详细信息

模型适应免费。

免费 S1
模型部署 1 模型 $-/模型/月
模型适应 3 小时/月 无限制
精确度测试 2 小时/月 前 2 小时免费,之后每小时 $-
横向扩展 不适用 $-/单位/天,其中每个单位可以发送 5 个并发请求
无跟踪 不适用 $-/模型/月
请求定价 2 小时/月 前 2 小时免费,之后每小时 $-

支持和 SLA

  • 包含计费及订阅管理的免费支持。
  • 需要针对预览服务的技术支持? 使用我们的论坛
  • 我们保证在标准级别运行的认知服务将在至少 99.9% 的时间可用。没有为“免费”级别提供任何 SLA。阅读 SLA
  • 预览期间无 SLA。了解更多

常见问题

自定义语音服务

  • 第 1 层可以同时处理多达 4 个音频(即 4 个转录),并能实时响应。如果用户发送 4 个以上并发音频,则每个后续音频都会被拒绝,同时返回一个错误代码,指示并发识别过多。对于可同时处理 12 个转录的第 2 层也是如此。免费层提供 1 个并发转录。它假定音频会实时上传。如果音频上传速度较快,出于并发性目的,在此音频持续时间结束之前仍会假定继续进行请求(即使可能早已返回识别结果)。

    注意:如果需要更高级别的并发,请联系我们

  • 语言模型是词语序列的概率分布。语言模型帮助系统根据词语序列本身发生的可能性,从发音类似的单词序列中做出选择。例如,“recognize speech”和“wreck a nice beach”发音类似,但前者的可能性要高得多,因此语言模型会给“recognize speech”分配更高的分值。如果希望应用程序的语音查询包含特定词汇项(例如日常语言中少用的产品名称或专用术语),那么很可能可以通过自定义语言模型获得更好的效果。例如,假如你正在构建通过语音搜索 MSDN 的应用,那么相较于一般语音应用程序,该应用用到“面向对象”、“命名空间”或“.Net”等术语的几率则很可能提升。自定义语言模型能让系统掌握这种差异。

  • 在每种语言中,声学模型是一个分类器,将短小声音片段标识为若干不同音素或声音单位中的一种。这些音素可以结合形成词语。例如,“speech”由四个音素“s p iy ch”组成。这些分类约按每秒 100 次的速度进行。自定义声学模型使系统能够学习更好地识别非典型环境中的语音。例如,如果研制了一款面向仓库或工厂工人的应用,那么相应的自定义声学模型可以在这类嘈杂的环境中更准确地识别语音。

  • 短语识别支持最多 15 秒钟的谈话。与语音客户端库一起使用时,当数据被发送到服务器时,客户端会接收到多个部分结果和一个从多个结果中选出的最佳最终结果。

  • 长时听写识别技术支持长达两分钟的语音。与语音客户端库一起使用时,当数据被发送到服务器时,基于服务器指示的语句停顿位置,客户端会接收到多个部分结果和多个最终结果。

  • 例如,如果客户使用 S1 层处理一百万个转录,将对其收取层次价 ($-),前 100,000 个转录按 $-/1,000 个收费,剩余 900,000 个转录按 $-/1,000 个收费。因此,实际上客户需付费 $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500

  • 请在 Microsoft 认知服务网页和自定义语音服务网站 www.cris.ai 处参阅自定义语音服务相关信息。

  • 自定义模型部署是包装自定义模型,然后将其作为服务公开的过程。生成的部署自定义模型会公开终结点,通过该终结点可以访问该自定义模型。用户可以根据需要选择部署的模型数量。

  • 通过自定义语音服务,用户可以根据自己的声学和语言数据来调整基准模型。我们称此过程为模型自定义。

  • 创建自定义模型后,用户可以上传测试数据以评估新创建的模型。用户可以根据需要使用大量数据测试新的自定义模型,即执行不限次数的精确度测试。

  • 部署自定义模型后,该模型的 URI 一次可以处理一个音频请求。在遇到同时向该 URI 发送多个音频请求的情况时,用户可以选择增加到一次处理五个并发请求。通过购买缩放单位可以实现这点。每个缩放单位最多可以保证五个并发音频请求,每个缩放单位的费用为 $200。例如,如果用户有 23 个音频请求,想要同时命中终结点,则需要购买五个缩放单位以保证最多 25 个并发请求。

  • 通过日志管理,用户可以关闭记录其部署模型。注重隐私的用户可以选择每月 $20 关闭记录部署模型。

  • 请求定价是指按部署的自定义模型的终结点处理音频请求的费用。

常规

  • The Emotion API, Face API, Language Understanding Intelligent Service API, Bing Speech-to-Text API, and Bing Text-to-Speech API are billed per 1,000 API transaction calls when a production API call is being actively executed. Billing is prorated for production API transaction call quantities.

    The Bing Long Form Speech API service is billed per hour of speech that is analyzed. The billing is prorated on a per-minute basis.

    The Recommendations API and Text Analytics API can be purchased in units of the standard tiers at a fixed price. Each unit of a tier comes with included quantities of API transactions. If the user exceeds the included quantities, overages are charged at the rate specified in the pricing table above. These overages are prorated, and the service is billed on a monthly basis. The included quantities in a tier are reset each month.

  • 如果达到免费级别的事务限制,则使用会受到限制。客户无法在免费级别超额使用。

  • Any annotation to a document counts as a transaction. Batch scoring calls will also take into consideration the number of documents that need to be scored in that transaction. So for instance, if 1,000 documents are sent for sentiment analysis in a single API call, that will count for 1,000 transactions. If an API supports more than one annotation operation, that will also be considered. Let’s say an API call performs both sentiment analysis and key-phrase extraction on 1,000 documents, that will count for 2,000 transactions (2 annotations * 1,000 documents).

  • 如果在标准级别超额使用,则帐户开始累加超额量。这些超额部分按照为每个级别指定的费率按月计费。

  • 任何 API 调用(批处理评分调用除外)都算作事务。批处理评分调用基于该事务中需评分的项数进行计费。

  • 如果达到免费级别的事务限制,则使用会受到限制。客户无法在免费级别超额使用。免费层不支持批处理评分。

  • 对于建议 API,可以按标准层计价单位以固定价格购买。每个单位的级别都包含一定数量的 API 事务。如果用户使用的数量超出了包含的数量,则超出部分将按上面的定价表中指定的费率收费。这些超出部分按比例计算,而服务按月计费。一个级别中包含的数量会每月重置。

  • 你可以随时升级到较高级别。较高级别对应的计费费率和包括的量将立即生效。

  • Below table provides a list of available end-points for each API. The response for the same end-point of Bing Web Search API may vary depending on the Tier purchased. Refer to the next question for details.

    Included APIs Endpoints Available in Tiers
    必应 Web 搜索 API https://api.cognitive.microsoft.com/bing/v7.0/search S1-S8
    必应图像搜索 API https://api.cognitive.microsoft.com/bing/v7.0/images/search S1, S3, S7, S8
    必应新闻搜索 API https://api.cognitive.microsoft.com/bing/v7.0/news/search S1, S5, S8
    必应视频搜索 API https://api.cognitive.microsoft.com/bing/v7.0/videos/search S1, S4, S7, S8
    (Preview, EN-US Only)
    https://api.cognitive.microsoft.com/bing/v7.0/entities S1, S6
    Bing Autosuggest API https://api.cognitive.microsoft.com/bing/v7.0/Suggestions S1, S2
    Bing Spell Check API https://api.cognitive.microsoft.com/bing/v7.0/spellcheck S1, S2
  • No, the Bing Web Search API is curtailed to meet specific offering of each Tier. For example, Tier S3 is meant for customers wanting to utilize only web search results and images in their applications. The customers also have an option of calling just a specific end point within a tier and their transactions will count against the overall bundle transactions (for example in Tier S3 a customer can just call Image API end point and make 400 transactions and can call Web Search API end point for 600 transactions and the total will be counted as 1,000 transactions).

  • No, both the APIs could potentially return different results even if you are only looking for images. For example, for a certain type of query, Bing Web Search API may return a combination of web results, videos, news but may not return images. However, for the same query, Bing Image Search API may return images.

  • Tiers are priced based on the number of transactions. As an example, for Tier S3, price per 1,000 transactions is $4. At the end of billing period if 12,000 transactions are logged for the Bing Web Search API and 1,000 transactions are logged for the Bing Image Search API, then you will have billed for $52 calculated as $4*(13,000/1,000).

  • Bing Spell Check and Bing Autosuggest APIs are billed at 25,000 transactions increment in Tier S1. Whereas, other APIs are billed at 1,000 transactions increment in Tier S1.

    For example, if you are subscribed to Tier S1 and at the end of the billing period 15,000 transactions are logged for the Bing Web Search API, 3,000 transactions logged for Bing Video Search API, and 25,000 for Bing Autosuggest API. In this case, the approximate bill would be $133 calculated by $7*((15,000+3,000)/1,000) + $7*(25,000/25,000).

    Note: For billing, only the end-point is considered and not the requested response. For example, calling the Bing Web Search API only for image response will be counted towards the Bing Web Search API and not towards the Bing Image Search API.

资源

估计每月的 Azure 服务费用

查看 Azure 定价常见问题

了解有关 认知服务 的更多信息

查看技术教程、视频和更多资源

了解并使用 $200 信用额度构建,继续免费使用

免费帐户