탐색 건너뛰기

Speech to Text

음성 오디오를 실행 가능하게 만들기

오디오를 100개 이상의 언어 및 변형으로 된 텍스트로 빠르고 정확하게 변환합니다. 모델을 사용자 지정하여 도메인별 용어의 정확도를 높입니다. 전사된 텍스트에 대한 검색 또는 분석을 사용하거나 작업을 촉진하여 음성 오디오에서 더 많은 가치를 얻으세요. 이 모든 작업을 선호하는 프로그래밍 언어로 수행할 수 있습니다.

고품질 전사

최첨단 음성 인식을 사용하여 정확한 음성 텍스트 변환 대화 내용 기록을 제공합니다.

사용자 지정 가능한 모델

기본 용어 모음에 특정 단어를 추가하거나 음성 텍스트 변환 모델을 직접 빌드합니다.

유연한 배포

클라우드 또는 컨테이너의 에지 등 어디서나 Speech to Text를 실행하세요.

프로덕션 준비

Microsoft 제품에서 음성 인식을 지원하는 강력한 동일 기술에 액세스하세요.

JavaScript SDK를 기반으로 빌드된 이 데모 앱을 이용해 Speech to Text 사용해 보기

마이크를 사용하여 자신의 음성으로 데모를 사용해 보려면 최신 버전의 Microsoft Edge, Firefox 또는 Chrome과 같은 WebRTC 지원을 제공하는 다른 브라우저로 변경하세요.

음성 데이터는 저장되지 않습니다.

다양한 원본에서 정확하게 음성 전사

마이크, 오디오 파일Blob 저장소를 비롯한 다양한 원본에서 오디오를 텍스트로 변환합니다. 화자 분할 마커를 사용하여 누가 무엇을 언제 말했는지 확인합니다. 자동 서식 지정 및 문장 부호로 읽기 가능한 대본을 가져옵니다.

요구 사항에 맞춘 음성 모델 사용자 지정

조직 및 업계 고유의 용어를 해석하도록 음성 모델을 조정합니다. 배경 소음, 강세 또는 독특한 어휘와 같은 음성 인식 장벽을 극복합니다. 오디오 데이터와 기록을 업로드하여 모델을 사용자 지정합니다. 자동으로 Office 365 데이터를 사용하여 사용자 지정 모델을 생성함으로써 조직의 음성 인식 정확도를 최적화할 수 있습니다.

어디서나 배포

데이터의 위치와 관계없이[음성을 텍스트로 변환]을 실행합니다. 컨테이너를 사용하여 강력한 클라우드 기능과 온-프레미스에 최적화된 음성 애플리케이션을 빌드합니다.

클라우드 AI 서비스로 앱 혁신 촉진

조직에서 AI를 시작하여 가치를 빠르게 실현할 수 있는 5가지 주요 방법을 알아봅니다.

포괄적인 개인 정보 보호 및 보안

  • Azure Cognitive Services의 일부인 음성 서비스는 SOC, FedRAMP, PCI DSS, HIPAA, HITECH, ISO 인증을 받았습니다.
  • 사용자의 데이터는 그대로 유지됩니다. 오디오 입력 및 대화 내용 기록 데이터는 오디오를 처리하는 동안 로그되지 않습니다.
  • 언제든지 사용자 지정 음성 데이터 및 모델을 보고 삭제할 수 있습니다. 데이터는 스토리지에 있는 동안 암호화됩니다.
  • Azure 인프라로 지원되는 음성 서비스는 엔터프라이즈급 보안, 가용성, 규정 준수, 관리 효율성을 제공합니다.

필요한 제어 기능을 제공하는 유연한 가격 책정

Speech to Text를 사용하면 오디오를 전사한 시간을 기준으로 선불 비용 없이 사용한 만큼만 비용을 지불합니다.

설명서 및 리소스

시작하기

설명서 찾아보기

Microsoft Learn 과정을 통해 음성 서비스 만들기

코드 샘플 살펴보기

샘플 코드 확인하기

사용자 지정 리소스 보기

Speech Studio로 음성 텍스트 변환 솔루션을 탐색하고 사용자 지정하세요. 코드가 필요하지 않습니다.

Speech to Text를 신뢰하는 비즈니스

통화 전사를 간소화하는 KPMG

KPMG는 Speech to Text로 수천 시간의 통화를 전사하고 분류하여 고객의 규정 준수 비용을 최대 80% 줄여 줍니다.

KPMG

응급 의료 요원이 음성을 사용하여 필수 데이터에 액세스할 수 있도록 지원하는 Motorola

Motorola Solutions는 경찰관과 기타 응급 의료 요원이 음성 지원 가상 도우미를 사용하여 중요한 정보에 더욱 빠르게 액세스할 수 있도록 지원합니다.

Motorola Solutions

음성 지원 스마트 홈 경험을 제공하는 Universal Electronics

Universal Electronics는 가정에서 일상적으로 사용하는 디바이스에서 작동하는 음성 지원 탐색 및 제어 기능이 특정 제품에서 제공되도록 지원함으로써 매우 독자적인 소비자 경험을 제공하고 있습니다.

Universal Electronics

Hochtief는 음성을 사용하여 건설 결함을 문서화합니다.

Hochtief는 프로젝트 관리자가 프로젝트 현장에서 음성이 지원되는 가상 도우미로 건축 결함을 파악하여 기록할 수 있도록 지원하고 있습니다.

Cheetah Mobile

회의 인사이트로 빠른 의사 결정을 내리는 NTT DATA

NTT DATA는 실시간 회의 전사를 통한 음성 데이터에서 다양한 인사이트를 얻고 있습니다. 또한 Custom Speech를 사용하여 음성 인식 모델이 특정한 조직 용어를 이해할 수 있도록 사용자 지정할 수 있습니다.

NTTDATA

대화형 뱅킹 경험을 촉진하는 Insight

Insight Enterprises는 대화형 AI 기반의 뱅킹 솔루션으로 은행들이 각 지점에 빠른 디지털 속도와 편리한 환경을 제공하도록 지원하고 있습니다. Speech to Text는 고객이 발화 내용을 처리 및 분석 가능한 데이터로 변환하여 고객에게 시기적절하고 관련성 있는 대응 서비스를 제공할 수 있습니다.

Insight Enterprise, Inc.

Speech to Text에 대해 자주 묻는 질문

  • 정확하고 신속하게 오디오를 텍스트로 전사하는 음성 서비스 내의 기능입니다.
  • Cognitive Services는 애플리케이션에 AI를 추가하는 데 사용할 수 있는 미리 작성된 사용자 지정 가능 AI 모델의 컬렉션입니다. 음성, 판독, 언어, 시각 등 다양한 도메인이 있습니다. Speech to Text는 음성 서비스 내의 한 기능입니다. 기타 음성 관련 기능에는 Text to Speech, Speech Translation, Speaker Recognition이 포함됩니다. 판독 서비스의 예로는 관련 맞춤형 환경을 제공할 수 있는 Personalizer가 있습니다. 언어 서비스의 예로는 Language Understanding, 자연어 처리를 위한 Text Analytics, FAQ 환경을 위한 QnA Maker, 언어 번역을 위한 Translator가 있습니다.

Speech 시작

무엇을 도와 드릴까요?