Zamiana tekstu na mowę

Konwertuj tekst na mowę w celu tworzenia bardziej naturalnych i lepiej dostępnych interfejsów

Mowa ludzka, a nie mowa robotów

Kompiluj aplikacje i usługi, które dzięki temu, że w sposób naturalny mówią do użytkowników, stają się bardziej dostępne i użyteczne. Konwertuj tekst na dźwięk w czasie zbliżonym do rzeczywistego, odtwarzaj go i zapisuj jako plik do późniejszego użycia. Funkcja zamiany tekstu na mowę jest dostępna w wersji neuronowej i standardowej.

Dzięki zastosowaniu najnowszych innowacji w obsłudze mowy cyfrowej funkcja neuronowej zamiany tekstu na mowę sprawia, że głosy w aplikacji są prawie nie do odróżnienia od nagrań osób. Naturalna wymowa odmienionych wyrazów i wyraźna artykulacja sprawiają, że słuchanie tekstu nie jest męczące podczas interakcji z systemami sztucznej inteligencji. Neuronowa zamiana tekstu na mowę umożliwia interakcje z czatbotami i asystentami wirtualnymi w sposób bardziej naturalny i angażujący użytkownika w większym stopniu. Pozwala również na konwertowanie tekstu cyfrowego, na przykład książki elektronicznej, na książkę audio, a także udoskonalanie samochodowych systemów nawigacyjnych.

Neuronowa zamiana tekstu na mowę w akcji

Angielski (USA) Jessa

Zdanie Próbka głosu
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Angielski (USA) Guy

Zdanie Próbka głosu
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chiński (CN): Xiaoxiao

Zdanie Próbka głosu
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Niemiecki (DE): Katja

Zdanie Próbka głosu
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Włoski (IT): Elsa

Zdanie Próbka głosu
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Chcesz to skompilować?

Standardowa funkcja zamiany tekstu na mowę umożliwia mówienie do użytkowników w wielu językach. Możesz wybierać spośród ponad 75 głosów w 45 językach lub ustawieniach regionalnych, w tym również głosy męskie i żeńskie. Dostosowuj parametry, takie jak szybkość, wysokość dźwięku, głośność, wymowa i dodatkowe przerwy.

Standardowa zamiana tekstu na mowę w akcji

Aby sprawdzić sposób działania syntezy mowy, naciśnij pozycję Odtwórz.*

Język Przykładowy tekst Próbka głosu
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Chcesz to skompilować?

Zamiana tekstu na mowę przy użyciu modeli usługi Custom Voice

Potrzebujesz nadać swojemu agentowi głosowemu unikalny i rozpoznawalny głos związany z Twoją marką? Funkcja dostosowywania głosu w ramach zamiany tekstu na mowę ułatwia tworzenie niepowtarzalnych aplikacji z obsługą głosu bez posiadania jakiegokolwiek doświadczenia.

Zobacz, jak to działa

Język

Jakość

Przykładowy tekst Próbka głosu

Chcesz rozpocząć tworzenie własnego modelu głosowego?

Łatwe tworzenie modeli głosowych

Aby dostosować agenta głosowego, po prostu nagraj i przekaż dane szkoleniowe, a w usłudze zostanie utworzona unikalna czcionka głosowa dostosowana do Twojego nagrania. Rozpocznij weryfikację koncepcji z małą ilością danych. Wraz ze wzrostem ilości danych w systemie będzie miało miejsce płynne skalowanie, co spowoduje wzrost jakości naturalnego głosu.

Spójna i zintegrowana

Modele usługi Custom Voice są w pełni zintegrowane z innymi usługami przetwarzania mowy usług Cognitive Services. Nie jest wymagane tworzenie kodu, a dostosowany model głosowy można w łatwy sposób wdrożyć w ramach interfejsu API.

Szybka i bezpieczna

Za pomocą unikalnego punktu końcowego interfejsu API i bezpiecznego zarządzania uwierzytelnianiem możesz szybko umieszczać czcionki głosowe na wszystkich platformach. Twoje modele są pod Twoją kontrolą.

Poznaj scenariusz dotyczący mowy

Inteligentny kiosk

Usługi głosowe połączone z usługą Language Understanding umożliwiają naturalną interakcję aplikacji i użytkowników. Użyj funkcji zamiany mowy na tekst do przechwycenia pytania użytkownika, usługi Language Understanding do analizy intencji i sformułowania odpowiedniej odpowiedzi, a funkcji zamiany tekstu na mowę do przekształcenia tekstu na odpowiedź w formie głosowej. Twórz interfejsy konwersacyjne na potrzeby różnych scenariuszy, takich jak bankowość, podróże i rozrywka.

Commerce ChatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional email and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The speech recognition service can be added to support voice commands.1234567
  1. Przegląd
  2. Przepływ

Czatbot komercyjny

Przegląd

Połączenie usługi Azure Bot Service i usługi interpretacji języka umożliwia deweloperom tworzenie interfejsów konwersacji dla różnych scenariuszy, na przykład dla branży usług finansowych, turystycznej i rozrywkowej. Na przykład konsjerż hotelowy może korzystać z bota w celu usprawnienia tradycyjnych interakcji za pośrednictwem poczty e-mail i rozmów telefonicznych, weryfikując klientów za pomocą usługi Azure Active Directory i korzystając z usług Cognitive Services w celu lepszego przetwarzania wyrażanych za pomocą tekstu i głosu żądań klientów w kontekście. W celu zapewnienia obsługi poleceń głosowych można dodać usługę rozpoznawania mowy.

Przepływ

  1. 1 Klient używa aplikacji mobilnej
  2. 2 Użytkownik uwierzytelnia się za pomocą usługi Azure AD B2C
  3. 3 Użytkownik zwraca się o informacje za pomocą niestandardowego bota aplikacji
  4. 4 Usługi Cognitive Services ułatwiają przetwarzanie żądania w języku naturalnym
  5. 5 Klient przegląda odpowiedź i może uściślić pytanie w ramach naturalnej konwersacji
  6. 6 Gdy użytkownik jest zadowolony z wyników, bot aplikacji aktualizuje rezerwację klienta
  7. 7 Usługa Application Insights zbiera dane telemetryczne środowiska uruchomieniowego, aby ułatwić ulepszanie wydajności i działania bota

"ROOBO is an AI solution provider. Now with Microsoft's world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei: Dyrektor ds. technicznych, roobo

Poznaj interfejsy API usług Cognitive Services

Przetwarzanie obrazów

Wyodrębnianie określonych informacji z obrazów

Rozpoznawanie twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Rozpoznawanie pisma odręcznego WERSJA ZAPOZNAWCZA

Oparta na sztucznej inteligencji usługa umożliwiająca rozpoznawanie zawartości w postaci pisma cyfrowego, na przykład pisma ręcznego, kształtów i układu pisanych odręcznie dokumentów

Indeksator wideo

Udostępnienie analiz wideo

Niestandardowe przetwarzanie obrazów

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Rozpoznawanie formularzy WERSJA ZAPOZNAWCZA

Napędzana przez sztuczną inteligencję usługa wyodrębniania dokumentów, która rozpoznaje formularze

Analiza tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Tłumaczenie tekstu w usłudze Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Language Understanding

Naucz aplikacje rozpoznawać polecenia użytkowników

Czytnik immersyjny WERSJA ZAPOZNAWCZA

Zwiększ możliwości użytkowników w każdym wieku i z różnymi zdolnościami w zakresie czytania i rozumienia tekstu

Usługi mowy

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

Rozpoznawanie osoby mówiącej WERSJA ZAPOZNAWCZA

Identyfikuj i weryfikuj osoby mówiące na podstawie głosu

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i wideo

Narzędzie do wykrywania anomalii WERSJA ZAPOZNAWCZA

Łatwo dodawaj funkcje wykrywania anomalii do aplikacji.

Personalizacja WERSJA ZAPOZNAWCZA

Usługa sztucznej inteligencji udostępniająca spersonalizowane środowisko użytkownika

Użyj zestawu Speech Devices SDK, aby utworzyć urządzenie asystujące i określić niestandardowe słowo aktywujące

Dowiedz się więcej