Cognitive Services 가격 - Custom Speech Service 미리 보기

인텔리전스 API를 사용하여 시각, 음성, 언어 및 지식 기능 사용

Custom Speech Service를 통해 사용자 지정 음성 인식 모델을 만들어 응용 프로그램에 맞춤화된 '음성을 텍스트로 변환' 끝점에 배포할 수 있습니다. Custom Speech Service를 사용하면 응용 프로그램의 어휘와 사용자의 말하기 스타일을 학습하도록 음성 인식기의 언어 모델을 사용자 지정할 수 있습니다. 응용 프로그램의 예상 환경과 사용자 인구에 더 잘 맞게 음성 인식기의 어쿠스틱 모델을 사용자 지정할 수도 있습니다.

가격 정보

모델 적응은 무료입니다.

무료 S1
모델 배포 1 모델 $-/모델/월
모델 적응 3시간/월 제한 없음
정확도 테스트 2시간/월 2 시간 무료, 이후 $-/시간
확장 N/A $-/단위/일(각 단위를 사용하여 5개의 동시 요청을 보낼 수 있음)
추적이 없음 N/A $-/모델/월
요청 가격 2시간/월 2 시간 무료, 이후 $-/시간

지원 및 SLA

  • 무료 청구 및 구독 관리 지원이 포함됩니다.
  • 미리 보기 서비스에 대한 기술 지원이 필요한가요? 포럼을 이용하세요.
  • 표준 계층에서 실행되는 Cognitive Services를 99.9% 이상의 시간 동안 이용할 수 있음을 보장합니다. 무료 계층에는 SLA가 제공되지 않습니다. SLA 읽어 보기
  • 미리 보기 기간 중 SLA가 없습니다. 자세히 알아보세요.

FAQ

Custom Speech Service

  • 계층 1에서는 동시에 최대 4개의 오디오 조각(즉, 4개의 기록)을 처리하면서 여전히 실시간으로 응답할 수 있습니다. 사용자가 5개 이상의 동시 오디오 조각을 보내면 이후 각 오디오 조각은 거부되고 동시 인식이 너무 많음을 나타내는 오류 코드와 함께 다시 전송됩니다. 12개의 동시 기록을 처리할 수 있는 계층 2에도 같은 내용이 적용됩니다. 무료 계층은 하나의 동시 기록을 제공합니다. 오디오가 실시간으로 업로드된다고 가정합니다. 오디오가 더 빠르게 업로드되는 경우 동시성 목적을 위해 요청은 오디오 기간이 지날 때까지 여전히 지속되는 것으로 가정됩니다(인식 결과가 이전에 다시 전송될 수 있더라도).

    참고: 더 높은 수준의 동시성이 필요한 경우 문의하세요.

  • 언어 모델은 단어의 시퀀스에 대한 확률 분포입니다. 언어 모델은 시스템이 단어 시퀀스 자체의 발생 가능성에 따라 비슷하게 들리는 단어의 시퀀스 중에서 결정하는 데 도움을 줍니다. 예를 들어 "recognize speech"와 "wreck a nice beach"는 비슷하게 들리지만 첫 번째 가설이 발생할 확률이 훨씬 더 높으므로 언어 모델에서 더 높은 점수를 할당합니다. 응용 프로그램에 대한 음성 쿼리에 특정 어휘 항목(예: 일반적인 말에서 드물게 나타나는 제품 이름 또는 전문 용어)이 포함될 것으로 예상하는 경우 언어 모델을 사용자 지정하여 향상된 성능을 얻을 수 있습니다. 예를 들어 음성으로 MSDN을 검색하는 앱을 빌드하는 경우 "개체 지향"이나 "네임스페이스" 또는 "닷넷"과 같은 용어가 일반적인 음성 응용 프로그램에서보다 더 빈번하게 나타날 수 있습니다. 언어 모델을 사용자 지정하면 시스템이 이러한 내용을 학습할 수 있습니다.

  • 어쿠스틱 모델은 각 언어로 된 오디오의 짧은 조각을 여러 음소 또는 소리 단위의 하나로 레이블을 지정하는 분류자입니다. 그런 다음 이러한 음소는 함께 연결되어 단어를 형성할 수 있습니다. 예를 들어 "speech"라는 단어는 4개의 음소 "s p iy ch"로 구성됩니다. 이러한 분류는 대략 초당 100번 만들어집니다. 어쿠스틱 모델을 사용자 지정하면 시스템이 이례적인 환경에서 음성 인식 작업을 더 잘 수행하는 방법을 학습할 수 있습니다. 예를 들어 창고나 공장에서 일하는 작업자가 사용하도록 설계된 앱이 있는 경우 사용자 지정된 어쿠스틱 모델은 이러한 환경에서 발생하는 소음이 존재할 때 음성을 더 정확하게 인식할 수 있습니다.

  • Short Phrase Recognition에서는 최대 15초 길이 발언을 지원합니다. Speech Client 라이브러리와 함께 사용될 경우 데이터가 서버로 전송되면 클라이언트는 여러 부분 결과와 최종 복수개 선택 결과 중 하나를 수신합니다.

  • Long Dictation Recognition에서는 최대 2분 길이 발언을 지원합니다. Speech Client 라이브러리와 함께 사용될 경우 데이터가 서버로 전송되면 클라이언트는 서버에서 문장 멈춤을 나타내는 위치를 기반으로 여러 부분 결과와 여러 최종 결과를 수신합니다.

  • 예를 들어 고객이 S1 계층을 사용하여 백만 개의 기록을 처리하는 경우 가격 계층($-)에 대한 요금이 청구되고 처음 100,000개의 기록은 1,000개 기록당 $-으로 청구되며 나머지 900,000개의 기록은 1,000개 기록당 $-으로 청구됩니다. 따라서 실제로 고객에게 $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500이 청구됩니다.

  • Microsoft Cognitive Services 웹 페이지 및 Custom Speech Service 웹 사이트 www.cris.ai에서 Custom Speech Service 정보를 참조하세요.

  • 사용자 지정 모델 배포는 사용자 지정 모델을 래핑한 다음 서비스로 내보내는 프로세스입니다. 이에 따라 배포된 사용자 지정 모델은 해당 모델에 액세스하는 데 사용할 수 있는 끝점을 노출합니다. 사용자는 모델을 필요한 수만큼 많이 배포할 수 있습니다.

  • Custom Speech Service를 사용하면 사용자가 고유한 어쿠스틱 및 언어 데이터를 기반으로 기준 모델을 조정할 수 있습니다. 이 프로세스를 모델 사용자 지정이라고 합니다.

  • 사용자 지정 모델을 만들 때 사용자는 테스트 데이터를 업로드하여 새로 만든 모델을 평가할 수도 있습니다. 사용자는 필요한 만큼 많은 데이터를 사용하여 새로운 사용자 지정 모델을 테스트할 수 있습니다(예: 무제한 정확도 테스트 실행).

  • 사용자 지정 모델을 배포할 때 해당 URI에서는 오디오 요청을 한 번에 하나씩 처리할 수 있습니다. 해당 URI에 오디오 요청을 동시에 2개 이상 보내는 시나리오에서는 사용자가 동시 요청을 한 번에 5개의 비율로 확장할 수 있습니다. 이렇게 하려면 배율 단위를 구입합니다. 각 배율 단위에서는 배율 단위당 $200의 비용으로 최대 5개의 동시 오디오 요청을 보장합니다. 예를 들어 사용자가 동시에 23개의 오디오 요청으로 해당 끝점에 도달한다고 예상하면 사용자는 5개의 배율 단위를 구입하여 최대 25개 동시 요청을 보장해야 합니다.

  • 로그 관리를 사용하면 사용자가 배포한 모델에 대해 로깅을 끌 수 있습니다. 개인 정보 노출이 걱정되는 사용자는 매월 $20의 요금을 내고 배포된 모델에 대해 로깅을 끄도록 선택할 수 있습니다.

  • 요청 가격은 배포된 사용자 지정 모델 끝점의 오디오 요청을 처리하는 비용을 나타냅니다.

일반

  • The Emotion API, Face API, Language Understanding Intelligent Service API, Bing Speech-to-Text API, and Bing Text-to-Speech API are billed per 1,000 API transaction calls when a production API call is being actively executed. Billing is prorated for production API transaction call quantities.

    The Bing Long Form Speech API service is billed per hour of speech that is analyzed. The billing is prorated on a per-minute basis.

    The Recommendations API and Text Analytics API can be purchased in units of the standard tiers at a fixed price. Each unit of a tier comes with included quantities of API transactions. If the user exceeds the included quantities, overages are charged at the rate specified in the pricing table above. These overages are prorated, and the service is billed on a monthly basis. The included quantities in a tier are reset each month.

  • 무료 계층에서 트랜잭션 한도에 도달하면 사용량이 제한됩니다. 고객은 무료 계층에서 초과분을 누적할 수 없습니다.

  • Any annotation to a document counts as a transaction. Batch scoring calls will also take into consideration the number of documents that need to be scored in that transaction. So for instance, if 1,000 documents are sent for sentiment analysis in a single API call, that will count for 1,000 transactions. If an API supports more than one annotation operation, that will also be considered. Let’s say an API call performs both sentiment analysis and key-phrase extraction on 1,000 documents, that will count for 2,000 transactions (2 annotations * 1,000 documents).

  • 표준 계층의 사용량을 초과하면 해당 계정에서 초과분을 누적하기 시작합니다. 이 초과분은 월 기준으로 요금이 청구되고 각 계정에 지정된 요금으로 계산됩니다.

  • 모든 API 호출(배치 평가 호출은 제외)은 트랜잭션으로 계산됩니다. 배치 평가 호출은 해당 트랜잭션에서 평가되어야 하는 항목 수를 기준으로 계산됩니다.

  • 무료 계층에서 트랜잭션 한도에 도달하면 사용량이 제한됩니다. 고객은 무료 계층에서 초과분을 누적할 수 없습니다. 무료 계층에서는 배치 평가가 지원되지 않습니다.

  • Recommendations API는 고정 가격의 표준 계층 단위로 구매할 수 있습니다. 각 계층 단위에는 포함된 API 트랜잭션 수량이 함께 제공됩니다. 사용자가 포함된 수량을 초과하면 위의 가격표에 지정된 요금으로 초과분이 청구됩니다. 이 초과분은 일할 계산되고 서비스는 월 기준으로 요금이 청구됩니다. 계층의 포함된 수량은 매월 초기화됩니다.

  • 언제든지 더 높은 계층으로 업그레이드할 수 있습니다. 더 높은 계층에 해당하는 청구 요금 및 포함된 수량은 즉시 시작됩니다.

  • Below table provides a list of available end-points for each API. The response for the same end-point of Bing Web Search API may vary depending on the Tier purchased. Refer to the next question for details.

    Included APIs Endpoints Available in Tiers
    Bing 웹 검색 API https://api.cognitive.microsoft.com/bing/v7.0/search S1-S8
    Bing Image Search API https://api.cognitive.microsoft.com/bing/v7.0/images/search S1, S3, S7, S8
    Bing News Search API https://api.cognitive.microsoft.com/bing/v7.0/news/search S1, S5, S8
    Bing 비디오 Search API https://api.cognitive.microsoft.com/bing/v7.0/videos/search S1, S4, S7, S8
    (Preview, EN-US Only)
    https://api.cognitive.microsoft.com/bing/v7.0/entities S1, S6
    Bing Autosuggest API https://api.cognitive.microsoft.com/bing/v7.0/autosuggest S1, S2
    Bing Spell Check API https://api.cognitive.microsoft.com/bing/v7.0/spellcheck S1, S2
  • No, the Bing Web Search API is curtailed to meet specific offering of each Tier. For example, Tier S3 is meant for customers wanting to utilize only web search results and images in their applications. The customers also have an option of calling just a specific end point within a tier and their transactions will count against the overall bundle transactions (for example in Tier S3 a customer can just call Image API end point and make 400 transactions and can call Web Search API end point for 600 transactions and the total will be counted as 1,000 transactions).

  • No, both the APIs could potentially return different results even if you are only looking for images. For example, for a certain type of query, Bing Web Search API may return a combination of web results, videos, news but may not return images. However, for the same query, Bing Image Search API may return images.

  • Tiers are priced based on the number of transactions. As an example, for Tier S3, price per 1,000 transactions is $4. At the end of billing period if 12,000 transactions are logged for the Bing Web Search API and 1,000 transactions are logged for the Bing Image Search API, then you will have billed for $52 calculated as $4*(13,000/1,000).

  • Bing Spell Check and Bing Autosuggest APIs are billed at 25,000 transactions increment in Tier S1. Whereas, other APIs are billed at 1,000 transactions increment in Tier S1.

    For example, if you are subscribed to Tier S1 and at the end of the billing period 15,000 transactions are logged for the Bing Web Search API, 3,000 transactions logged for Bing Video Search API, and 25,000 for Bing Autosuggest API. In this case, the approximate bill would be $133 calculated by $7*((15,000+3,000)/1,000) + $7*(25,000/25,000).

    Note: For billing, only the end-point is considered and not the requested response. For example, calling the Bing Web Search API only for image response will be counted towards the Bing Web Search API and not towards the Bing Image Search API.

리소스

Azure 서비스의 월별 예상 비용을 산정해 보세요

Azure 가격 FAQ(질문과 대답) 검토

Cognitive 서비스에 대한 자세한 정보

기술 자습서, 비디오 및 기타 리소스 검토

$200 크레딧으로 배우고 빌드하고 무료로 계속 이용할 수 있습니다.

무료 계정