음성 API 서비스 유형

Azure Cognitive Services Speech Service를 사용하여 음성 텍스트 변환, 텍스트 음성 변환, 음성 변환 및 화자 인식을 비롯한 음성 언어 변환을 수행할 수 있습니다.

참고

용어 또는 구에 대한 인사이트를 수집하거나 음성 또는 서면 언어에 대한 자세한 컨텍스트 분석을 얻으려면 Azure Cognitive Service for Language 를 사용합니다.

서비스

  • 음성 텍스트 변환은 오디오 스트림을 실시간으로 또는 일괄 처리로 텍스트로 변환할 수 있습니다.
  • 텍스트 음성 변환 을 사용하면 애플리케이션에서 텍스트를 인간과 유사한 음성으로 변환할 수 있습니다.
  • 음성 번역 은 오디오 스트림의 다국어 음성 음성 변환 및 음성 텍스트 변환을 제공합니다.

음성 서비스를 선택하는 방법

이 순서도는 필요에 맞는 음성 서비스를 선택하는 데 도움이 될 수 있습니다.

음성 서비스를 선택하는 방법을 보여 주는 다이어그램

다이어그램의 왼쪽은 오디오-오디오 또는 오디오-텍스트 변환 프로세스를 보여 줍니다.

  • 음성 텍스트 변환은 음성을 오디오 원본에서 텍스트 형식으로 변환하는 데 사용됩니다.
  • 음성 음성 변환은 한 언어의 음성을 다른 언어로 음성으로 번역하는 데 사용됩니다.

다이어그램의 오른쪽은 텍스트-오디오 프로세스를 보여 줍니다.

  • 텍스트 음성 변환은 텍스트 원본에서 음성 오디오를 생성하는 데 사용됩니다.

일반 사용 예

다음 표에서는 몇 가지 일반적인 사용 사례에 대한 서비스를 권장합니다.

사용 사례 사용할 서비스
녹화된 비디오 또는 라이브 비디오에 대한 선택 자막 제공 음성 텍스트 변환
전화 통화 또는 모임의 대본 만들기 음성 텍스트 변환
자동화된 메모 받아쓰기 구현 음성 텍스트 변환
추가 처리를 위해 의도한 사용자 입력 확인 음성 텍스트 변환
사용자 입력에 대한 음성 응답 생성 텍스트 음성 변환
전화 시스템용 음성 메뉴 만들기 텍스트 음성 변환
핸즈프리 시나리오에서 전자 메일 또는 문자 메시지를 소리 내어 읽기 텍스트 음성 변환
기차역이나 공항과 같은 공공 장소에서 공지 방송 텍스트 음성 변환
음성 또는 음성 대화의 동시 양방향 번역을 위한 실시간 선택 자막 생성 음성 텍스트 변환

참가자

Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.

주요 작성자:

기타 기여자:

비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.

다음 단계