음성 텍스트 변환

더 자연스럽게 상호 작용할 수 있도록 음성 오디오를 텍스트로 변환

고급 음성 인식

Speech 서비스의 일부인 Speech to Text를 사용하여 다양한 소스의 오디오를 텍스트로 신속하게 변환할 수 있습니다. 모델을 사용자 지정하여 독특한 어휘, 말하기 스타일 또는 배경 소음과 같은 일반적인 음성 인식 장애 요인을 극복할 수 있습니다. 모든 사람이 실시간으로 대화를 따라잡고 대화에 참여하도록 지원함으로써 오디오 접근성을 향상합니다.

파격적인 혁신

심층 신경망 모델에서 지원하는 최첨단 음성 인식 정확도의 이점을 활용할 수 있습니다.

실시간 참여

대화의 모든 참가자가 완전히 참여할 수 있도록 실시간으로 오디오를 텍스트로 변환할 수 있습니다.

사용자 지정 음성 인식

말하기 스타일 및 분야별 용어에 맞게 음성 인식을 조정할 수 있습니다.

유연한 배포

클라우드, 온-프레미스, 컨테이너 에지 등 어느 곳에서나 Speech to Text를 실행할 수 있습니다.

혁신적인 음성 기술 사용

수십 년 동안 축적된 혁신적인 연구를 기반으로 하는 음성 기능으로 앱을 향상하세요. Microsoft는 스위치보드 대화 음성 인식 작업에서 최초로 인간과 동등한 수준을 달성하였으며 음성 인식에 대한 최첨단 연구를 계속 추진하고 있습니다.

음성 분야의 발전에 대해 자세히 알아보기

마이크를 사용하여 자신의 음성으로 데모를 사용해 보려면 최신 버전의 Microsoft Edge, Firefox 또는 Chrome과 같은 WebRTC 지원을 제공하는 다른 브라우저로 변경하세요.

빌드해 보시겠어요?

맞춤형 모델로 음성 인식 최적화

음성 인식 모델을 사용자 지정하여 일반적인 음성 인식 장애 요인을 극복할 수 있습니다. 사용자의 말하기 스타일, 억양 또는 지명, 제품 및 산업별 표현과 같은 고유한 어휘에 맞게 언어 모델을 조정할 수 있습니다. Office 365 데이터를 사용하여 사용자 지정 모델을 자동으로 생성함으로써 조직에 고유한 용어의 음성 인식 정확도를 최적화할 수 있습니다.

Custom Speech 사용 시작

샘플 문장

기준

Custom Speech

빌드해 보시겠어요?

대화 분석을 통한 인사이트 확보

여러 사용자의 대화를 실시간으로 기록하므로 참가자가 토론에 집중할 수 있습니다. 누가 언제 무슨 말을 했는지 파악하고, 다음 단계에서 신속하게 내용을 따라잡을 수 있습니다. 다중 마이크 디바이스 환경을 최적화할 수 있습니다. 기록된 텍스트에 대한 분석을 통해 대화에서 심층적인 인사이트를 얻을 수 있습니다.

대화 전사 기능에 대해 자세히 알아보기

클라우드에서 에지에 이르기까지 어디서나 배포

데이터 보안 및 짧은 대기 시간이 가장 중요한 시나리오의 경우 컨테이너를 사용하여 클라우드 또는 온-프레미스에서 Speech to Text를 실행할 수 있습니다.

컨테이너의 Speech에 대해 자세히 알아보기

엔터프라이즈를 위한 보안

  • Microsoft는 사이버 보안 연구 및 개발에 매년 미화 10억 달러 넘게 투자합니다.

  • Microsoft에 소속된 보안 전문가 3,500여 명이 여러분의 데이터 보안 및 개인 정보 보호를 철저히 전담합니다.

  • Azure는 다른 어떤 클라우드 공급 기업보다도 많은 규정 준수 인증을 취득했습니다. 전체 목록을 확인하세요.

유연한 가격으로 필요한 성능과 제어 및 사용자 지정 확보

사전 투자 비용 없이 사용한 만큼만 요금 지불 Speech to Text를 사용하면 오디오를 텍스트로 기록한 시간에 따라 종량제로 비용을 지불할 수 있습니다.

Speech to Text 가격 책정 확인

3단계로 Speech to Text 시작하기

Azure 체험 계정에 가입하여 즉시 액세스 권한과 200 USD 크레딧을 받습니다.
Azure Portal에 로그인하고 Speech를 추가합니다.
빠른 시작설명서에서 Speech to Text를 포함하는 방법을 알아봅니다.

Speech to Text용 개발자 리소스

설명서 및 자습서

Speech to Text를 시작하세요.

교육과정

Speech to Text 사용 절차를 안내하는 Pluralsight 과정을 수강하세요.

사례 사용

대화 및 콜 센터 전사와 같은 Speech to Text 시나리오에 대해 자세히 알아보세요.

Speech to Text에 대해 자주 묻는 질문

  • Speech to Text에서 지원하는 전체 언어 목록은 설명서를 참조하세요.
  • Speech SDK 및 REST API를 사용하면 손쉽게 마이크에서 오디오를 캡처하거나 스트림에서 읽거나 스토리지의 오디오 파일에 액세스할 수 있습니다. Speech SDK는 음성 인식을 위해 WAV/PCM 16비트, 16kHz/8kHz, 단일 채널 오디오를 지원합니다. 음성 텍스트 변환 REST 엔드포인트 또는 일괄 처리 전사 서비스를 사용하여 추가 오디오 형식을 지원합니다.
  • 지역별 가용성을 확인하세요.

Speech to Text 시작