Cognitive Services 가격 - Custom Speech Service 미리 보기

인텔리전스 API를 사용하여 시각, 음성, 언어 및 지식 기능 사용

Custom Speech Service를 통해 사용자 지정 음성 인식 모델을 만들어 응용 프로그램에 맞춤화된 '음성을 텍스트로 변환' 끝점에 배포할 수 있습니다. Custom Speech Service를 사용하면 응용 프로그램의 어휘와 사용자의 말하기 스타일을 학습하도록 음성 인식기의 언어 모델을 사용자 지정할 수 있습니다. 응용 프로그램의 예상 환경과 사용자 인구에 더 잘 맞게 음성 인식기의 어쿠스틱 모델을 사용자 지정할 수도 있습니다.

가격 정보

모델 적응은 무료입니다.

무료 S1
Model Deployments 1 model $-/model/month
Model Adaptation 3 hours/month Unlimited
정확도 테스트 2 hours/month 2 hours free and then $-/hour
확장 N/A $-/단위/일(각 단위를 사용하여 5개의 동시 요청을 보낼 수 있음)
추적이 없음 N/A $-/모델/월
요청 가격 2 hours/month 2 hours free and then $-/hour

지원 및 SLA

  • 무료 청구 및 구독 관리 지원
  • 미리 보기 서비스에 대한 기술 지원이 필요한가요? 포럼 이용
  • 표준 계층에서 실행되는 Cognitive Services를 99.9% 이상의 시간 동안 이용할 수 있음을 보장합니다. 무료 계층에는 SLA가 제공되지 않습니다. SLA 읽어 보기
  • 미리 보기 기간 중 SLA가 없습니다. 자세한 정보

FAQ

Custom Speech Service

  • 계층 1에서는 동시에 최대 4개의 오디오 조각(즉, 4개의 기록)을 처리하면서 여전히 실시간으로 응답할 수 있습니다. 사용자가 5개 이상의 동시 오디오 조각을 보내면 이후 각 오디오 조각은 거부되고 동시 인식이 너무 많음을 나타내는 오류 코드와 함께 다시 전송됩니다. 12개의 동시 기록을 처리할 수 있는 계층 2에도 같은 내용이 적용됩니다. 무료 계층은 하나의 동시 기록을 제공합니다. 오디오가 실시간으로 업로드된다고 가정합니다. 오디오가 더 빠르게 업로드되는 경우 동시성 목적을 위해 요청은 오디오 기간이 지날 때까지 여전히 지속되는 것으로 가정됩니다(인식 결과가 이전에 다시 전송될 수 있더라도).

    참고: 더 높은 수준의 동시성이 필요한 경우 문의하세요.

  • 언어 모델은 단어의 시퀀스에 대한 확률 분포입니다. 언어 모델은 시스템이 단어 시퀀스 자체의 발생 가능성에 따라 비슷하게 들리는 단어의 시퀀스 중에서 결정하는 데 도움을 줍니다. 예를 들어 "recognize speech"와 "wreck a nice beach"는 비슷하게 들리지만 첫 번째 가설이 발생할 확률이 훨씬 더 높으므로 언어 모델에서 더 높은 점수를 할당합니다. 응용 프로그램에 대한 음성 쿼리에 특정 어휘 항목(예: 일반적인 말에서 드물게 나타나는 제품 이름 또는 전문 용어)이 포함될 것으로 예상하는 경우 언어 모델을 사용자 지정하여 향상된 성능을 얻을 수 있습니다. 예를 들어 음성으로 MSDN을 검색하는 앱을 빌드하는 경우 "개체 지향"이나 "네임스페이스" 또는 "닷넷"과 같은 용어가 일반적인 음성 응용 프로그램에서보다 더 빈번하게 나타날 수 있습니다. 언어 모델을 사용자 지정하면 시스템이 이러한 내용을 학습할 수 있습니다.

  • 어쿠스틱 모델은 각 언어로 된 오디오의 짧은 조각을 여러 음소 또는 소리 단위의 하나로 레이블을 지정하는 분류자입니다. 그런 다음 이러한 음소는 함께 연결되어 단어를 형성할 수 있습니다. 예를 들어 "speech"라는 단어는 4개의 음소 "s p iy ch"로 구성됩니다. 이러한 분류는 대략 초당 100번 만들어집니다. 어쿠스틱 모델을 사용자 지정하면 시스템이 이례적인 환경에서 음성 인식 작업을 더 잘 수행하는 방법을 학습할 수 있습니다. 예를 들어 창고나 공장에서 일하는 작업자가 사용하도록 설계된 앱이 있는 경우 사용자 지정된 어쿠스틱 모델은 이러한 환경에서 발생하는 소음이 존재할 때 음성을 더 정확하게 인식할 수 있습니다.

  • Short Phrase Recognition에서는 최대 15초 길이 발언을 지원합니다. Speech Client 라이브러리와 함께 사용될 경우 데이터가 서버로 전송되면 클라이언트는 여러 부분 결과와 최종 복수개 선택 결과 중 하나를 수신합니다.

  • Long Dictation Recognition에서는 최대 2분 길이 발언을 지원합니다. Speech Client 라이브러리와 함께 사용될 경우 데이터가 서버로 전송되면 클라이언트는 서버에서 문장 멈춤을 나타내는 위치를 기반으로 여러 부분 결과와 여러 최종 결과를 수신합니다.

  • 예를 들어 고객이 S1 계층을 사용하여 백만 개의 기록을 처리하는 경우 가격 계층($-)에 대한 요금이 청구되고 처음 100,000개의 기록은 1,000개 기록당 $-으로 청구되며 나머지 900,000개의 기록은 1,000개 기록당 $-으로 청구됩니다. 따라서 실제로 고객에게 $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500이 청구됩니다.

  • Microsoft Cognitive Services 웹 페이지 및 Custom Speech Service 웹 사이트 www.cris.ai에서 Custom Speech Service 정보를 참조하세요.

  • 사용자 지정 모델 배포는 사용자 지정 모델을 래핑한 다음 서비스로 내보내는 프로세스입니다. 이에 따라 배포된 사용자 지정 모델은 해당 모델에 액세스하는 데 사용할 수 있는 끝점을 노출합니다. 사용자는 모델을 필요한 수만큼 많이 배포할 수 있습니다.

  • Custom Speech Service를 사용하면 사용자가 고유한 어쿠스틱 및 언어 데이터를 기반으로 기준 모델을 조정할 수 있습니다. 이 프로세스를 모델 사용자 지정이라고 합니다.

  • 사용자 지정 모델을 만들 때 사용자는 테스트 데이터를 업로드하여 새로 만든 모델을 평가할 수도 있습니다. 사용자는 필요한 만큼 많은 데이터를 사용하여 새로운 사용자 지정 모델을 테스트할 수 있습니다(예: 무제한 정확도 테스트 실행).

  • 사용자 지정 모델을 배포할 때 해당 URI에서는 오디오 요청을 한 번에 하나씩 처리할 수 있습니다. 해당 URI에 오디오 요청을 동시에 2개 이상 보내는 시나리오에서는 사용자가 동시 요청을 한 번에 5개의 비율로 확장할 수 있습니다. 이렇게 하려면 배율 단위를 구입합니다. 각 배율 단위에서는 배율 단위당 $200의 비용으로 최대 5개의 동시 오디오 요청을 보장합니다. 예를 들어 사용자가 동시에 23개의 오디오 요청으로 해당 끝점에 도달한다고 예상하면 사용자는 5개의 배율 단위를 구입하여 최대 25개 동시 요청을 보장해야 합니다.

  • 로그 관리를 사용하면 사용자가 배포한 모델에 대해 로깅을 끌 수 있습니다. 개인 정보 노출이 걱정되는 사용자는 매월 $20의 요금을 내고 배포된 모델에 대해 로깅을 끄도록 선택할 수 있습니다.

  • 요청 가격은 배포된 사용자 지정 모델 끝점의 오디오 요청을 처리하는 비용을 나타냅니다.

일반

  • Emotion API, Face API, Language Understanding Intelligent Service API, Bing Speech to Text API, Bing Text to Speech API는 프로덕션 API가 실제로 실행 중일 때 1,000개의 API 트랜잭션 호출을 기준으로 요금이 청구됩니다. 요금은 프로덕션 API 트랜잭션 호출 수량별로 일할 계산됩니다.

    Bing Long Form Speech API 서비스는 분석된 음성 시간을 기준으로 요금이 청구됩니다. 요금은 분 단위로 일할 계산됩니다.

    Recommendations API 및 Text Analytics API는 고정 가격의 표준 계층 단위로 구매할 수 있습니다. 각 계층 단위에는 포함된 API 트랜잭션 수량이 함께 제공됩니다. 사용자가 포함된 수량을 초과하면 위의 가격표에 지정된 요금으로 초과분이 청구됩니다. 이 초과분은 일할 계산되고 서비스는 월 기준으로 요금이 청구됩니다. 계층의 포함된 수량은 매월 초기화됩니다.

  • 무료 계층에서 트랜잭션 한도에 도달하면 사용량이 제한됩니다. 고객은 무료 계층에서 초과분을 누적할 수 없습니다.

  • 표준 계층의 사용량을 초과하면 해당 계정에서 초과분을 누적하기 시작합니다. 이 초과분은 월 기준으로 요금이 청구되고 각 계정에 지정된 요금으로 계산됩니다.

  • 모든 API 호출(배치 평가 호출은 제외)은 트랜잭션으로 계산됩니다. 배치 평가 호출은 해당 트랜잭션에서 평가되어야 하는 항목 수를 기준으로 계산됩니다.

  • 무료 계층에서 트랜잭션 한도에 도달하면 사용량이 제한됩니다. 고객은 무료 계층에서 초과분을 누적할 수 없습니다. 무료 계층에서는 배치 평가가 지원되지 않습니다.

  • Recommendations API는 고정 가격의 표준 계층 단위로 구매할 수 있습니다. 각 계층 단위에는 포함된 API 트랜잭션 수량이 함께 제공됩니다. 사용자가 포함된 수량을 초과하면 위의 가격표에 지정된 요금으로 초과분이 청구됩니다. 이 초과분은 일할 계산되고 서비스는 월 기준으로 요금이 청구됩니다. 계층의 포함된 수량은 매월 초기화됩니다.

  • Bing Search API, Bing 자동 제안 API 및 Bing 맞춤법 검사기 API는 월 기준으로 요금이 청구됩니다. 구매한 계층에 따라 API 호출로 정의된 포함된 트랜잭션 수량이 있습니다. 포함된 수량은 사용 시작과 관계없이 항상 월에 연결됩니다. 사용자가 포함된 수량을 초과하면 가격표에 지정된 요금으로 초과분이 청구됩니다. 이러한 초과분은 일할 계산되지 않고 서비스는 월 기준으로 요금이 청구됩니다. 각 계층의 포함된 수량은 매월 초기화됩니다.

  • Please visit the Cognitive Services subscription page to request free trials.

  • 언제든지 더 높은 계층으로 업그레이드할 수 있습니다. 더 높은 계층에 해당하는 청구 요금 및 포함된 수량은 즉시 시작됩니다.

리소스

계산기

Azure 서비스의 월별 예상 비용을 산정해 보세요

구입 FAQ

Azure 가격 FAQ(질문과 대답) 검토

제품 세부 정보

Cognitive 서비스에 대한 자세한 정보

설명서

기술 자습서, 비디오 및 기타 리소스 검토

지금 등록하여 $200 Azure 크레딧을 받으세요.

지금 시작