텍스트를 음성으로 전환 (TTS)

텍스트를 실제와 같은 음성으로 변환하여 더욱 자연스러운 인터페이스를 구현하세요.

로봇이 아닌 인간의 음성으로

Speech 서비스의 일부인 Text to Speech를 사용하여 자연어로 말하는 앱과 서비스를 빌드하세요. 다양한 언어의 다양한 음성을 사용하여 솔루션에 사람의 온기를 불어넣으세요. 음성 합성 기술의 혁신적인 연구 결과를 바탕으로 탄생한 인공신경망 Text to Speech 기능을 사용하여 실제와 같은 음성을 만드세요. 모델을 사용자 지정하여 솔루션 및 브랜드 고유의 음성을 만들 수 있습니다.

실제 같은 음성

사람의 목소리와 똑같이 강조 패턴과 어조를 구현하는 매끄럽고 자연스러운 음성을 사용하세요.

글로벌 규모

45개의 언어와 부속 언어로 80개가 넘는 음성을 사용하여 전 세계 사용자에게 도달하세요.

사용자 지정 환경

단 몇 분 동안 데이터를 학습시키는 것에서 시작하여 앱에 적용할 브랜드 고유의 음성을 빌드하세요.

최적화된 오디오

속도, 볼륨, 발음과 같은 특성을 간편하게 조절하여 각종 시나리오에 맞도록 음성 출력을 세밀하게 조정하세요.

자연스럽게 들리는 음성 생성

사람과 똑같이 자연스러운 어조와 또렷한 발음을 갖춘 새로운 음성을 앱에 적용하세요. Text to Speech는 심층 신경망을 사용하여 컴퓨터의 음성을 실제 사람의 음성과 구분할 수 없을 정도로 뛰어난 표현력을 갖추도록 만듭니다.

영어(미국): Aria

문장 음성 샘플
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

영어(미국): Guy

문장 음성 샘플
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

중국어(중국): Xiaoxiao

문장 음성 샘플
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

독일어(독일): Katja

문장 음성 샘플
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

이탈리아어(이탈리아): Elsa

문장 음성 샘플
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

빌드해 보시겠어요?

실시간으로 전 세계 사용자와 소통

텍스트를 실시간으로 오디오로 변환하여 매끄러운 대화 환경을 구현하세요. 45개의 언어와 부속 언어로 80개가 넘는 음성을 사용하여 전 세계 사용자에게 도달하세요.

언어 샘플 텍스트 음성 샘플
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (TR) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

빌드해 보시겠어요?

브랜드 고유의 음성 만들기

코드 줄을 전혀 작성할 필요 없이, 단 몇 분 동안 오디오를 학습시키는 것에서 시작하여 고유한 음성을 빌드하세요. 사용자 지정 신경망 음성 기능을 갖춘 심층 신경망 모델을 사용하여 사람과 똑같이 자연스러운 사용자 지정 음성을 만들어 보세요. 이렇게 만든 음성은 실시간 시나리오에도, 길이가 긴 오디오 콘텐츠를 합성하는 데도 사용할 수 있습니다.

언어

품질

샘플 텍스트 음성 샘플

고유한 음성 모델을 빌드하고 싶으신가요?

간편하게 맞춤화하는 오디오 출력

속도, 발음, 피치, 볼륨, 어조, 단어 사이의 정지 시간과 같은 매개 변수를 제어하여 실시간으로 텍스트-오디오 출력을 미세 조정하세요. 인공신경망 음성을 사용하면 경쾌함이나 공감을 표현하도록, 또는 가벼운 어조의 수다나 공식적인 어조의 뉴스 보도와 같이 특정 시나리오에 맞게 발화 스타일을 조절할 수 있습니다.

음성 튜닝에 대해 자세히 알아보기

클라우드에서 에지에 이르기까지 어디서나 배포

데이터 보안 및 짧은 대기 시간이 가장 중요한 시나리오의 경우 컨테이너를 사용하여 클라우드 또는 온-프레미스에서 Text to Speech를 실행할 수 있습니다. 이제 Speech 컨테이너나 표준 음성과 사용자 지정 음성을 모두 지원합니다.

컨테이너의 Speech에 대해 자세히 알아보기

엔터프라이즈를 위한 보안

  • Microsoft는 사이버 보안 연구 및 개발에 연간 USD 1 billion 이상을 투자합니다.

  • Microsoft는 전적으로 데이터 및 개인 정보 보호에 집중하는 보안 전문가를 3,500명 이상 고용합니다.

  • Azure는 다른 어떤 클라우드 공급 기업보다도 많은 인증을 취득했습니다. 전체 목록을 확인하세요.

유연한 가격으로 필요한 성능과 제어 및 사용자 지정 확보

사전 투자 비용 없이 사용한 만큼만 요금 지불 Text to Speech를 사용하면 오디오로 변환한 문자 수를 기반으로 종량제 요금을 지불할 수 있습니다.

책임 있는 인공신경망 음성을 위한 지침

합성 음성의 책임 있는 배포에 대해 알아보기

합성 음성은 다른 사람의 신뢰를 얻을 수 있는 방식으로 설계되어야 합니다. 회사와 서비스에서 신뢰를 얻을 수 있도록 합성 음성을 빌드하기 위한 원칙을 알아보세요.

책임 있는 배포 지침 읽기

성우의 동의 얻기

성우가 인공신경망 텍스트 음성 변환의 작동 방식과 오디오 녹음 프로세스를 완료한 후 인공신경망 텍스트 음성 변환이 사용되는 방식을 이해하는 데 도움을 줍니다.

성우에 대한 공개 지침 읽어보기

투명성 유지

사용자에게는 합성 음성을 듣고 있다는 사실을, 성우에게는 자신의 음성이 어떤 용도로 사용될지를 고지하세요.

Microsoft 공개 지침 보기 Microsoft의 책임 있는 접근 방식 알아보기

문의하기

사용자 지정 신경망 음성 기능은 현재 제어된 미리 보기 상태에 있습니다. 여기에서 게이트 프로세스와 액세스 권한을 받는 방법을 알아보세요.

3단계로 시작하는 Text to Speech

Azure 체험 계정에 가입하여 즉시 액세스 권한을 받고 $200 크레딧을 받으세요.

Azure Portal에 로그인하고 음성을 추가합니다.

빠른 시작설명서에서 Text to Speech를 포함하는 방법을 알아봅니다.

Text to Speech를 위한 개발자 리소스

설명서 및 자습서

Text to Speech 시작

교육과정

Text to Speech 사용 절차를 안내하는 Pluralsight 과정을 수강하세요.

과정 수강

Text to Speech에 대해 자주 묻는 질문

  • 표준 음성은 통계적 파라메트릭 합성과 연결 합성 기법을 사용하여 만들어집니다. 자연스럽고 듣기 편한 이러한 음성은 앱이 45개 이상 언어의 다양한 음성 옵션을 사용하여 말하도록 구현하는 데 사용할 수 있습니다.

    인공신경망 음성은 심층 신경망을 사용하여 음성 언어의 강세 및 음조 패턴을 매칭하고 음성 단위를 컴퓨터 음성으로 합성하는 데 한계가 있었던 기존의 텍스트 음성 변환 시스템의 문제를 해결합니다. 표준적인 텍스트 음성 변환에서는 운율을 개별적인 스텝으로 나눠서 언어학적 분석 및 음향 예측을 수행합니다. 이때 언어학적 분석과 음향 예측에 각각 독립적인 모델이 적용되는데, 이로 인해 소리가 왜곡된 음성 합성이 이루어질 수 있습니다. Microsoft의 인공신경망 기능은 운율 예측과 음성 합성을 동시에 수행하기 때문에 보다 매끄럽고 자연스럽게 들리는 음성이 만들어집니다.
  • 전체 목록은 설명서를 참조하세요.
  • 지역별 가용성을 확인하세요.

Speech 시작