Zamiana tekstu na mowę
A Speech service feature that converts text to lifelike speech
Ożywianie aplikacji za pomocą naturalnie brzmiących głosów
Twórz aplikacje oraz usługi, które mówią naturalnie, wybierając spośród ponad 270 neuronowych głosów oraz ponad 119 języków i wariantów. Wyróżnij swoją markę za pomocą dostosowanego, realistycznego głosu i uzyskaj dostęp do głosów z różnymi stylami mówienia i tonami emocjonalnymi, aby dopasować je do twojego przypadku użycia — od czytników tekstu po czatboty pomocy technicznej.
Realistyczna mowa zsyntetyzowana
Skorzystaj z płynnej, naturalnie brzmiącej funkcji zamiany tekstu na mowę, naśladującej intonację ludzkiego głosu.
Dostosowywalne głosy osób wymawiających tekst
Utwórz unikatowy generator głosu sztucznej inteligencji, który odzwierciedla tożsamość marki.
Precyzyjne kontrolki dźwięku zamiany tekstu na mowę
Dostosowuj głos w swoich scenariuszach, łatwo regulując szybkość, wysokość, wymowę, pauzy i wiele więcej.
Elastyczne wdrożenia
Uruchamiaj zamianę tekstu na mowę w dowolnym miejscu — w chmurze, w środowisku lokalnym lub na urządzeniach brzegowych w kontenerach.
Uzyskaj dostęp do wielu różnych głosów dla każdego scenariusza
Zaangażuj odbiorców globalnych przy użyciu ponad 330 głosów neuronowych w 129 językach i wariantach. Ożyw swoje scenariusze, takie jak czytniki tekstu i asystenci z obsługą głosu, dzięki głosom bardzo ekspresyjnym i ludzkim. Neuronowa zamiana tekstu na mowę obsługuje kilka stylów mówienia, w tym emisję wiadomości, obsługę klienta, krzyczenie, szeptanie oraz emocje, takie jak radość i smutek.
Wypróbuj funkcję zamiany tekstu na mowę za pomocą tej aplikacji demonstracyjnej utworzonej na podstawie naszego zestawu JavaScript SDK
Uwaga: Dane nie będą przechowywane.
Dowiedz się, jak to utworzyćUwaga: Dane nie będą przechowywane.
Dowiedz się, jak to utworzyćDostosowywanie głosowych danych wyjściowych
Precyzyjnie dostosuj syntetyzowaną mowę, aby pasowała do scenariusza. Zdefiniuj leksykony i steruj parametrami mowy, takimi jak wymowa, wysokość, szybkość, pauzy i intonacja za pomocą języka Speech Synthesis Markup Language (SSML) lub za pomocą narzędzia do tworzenia zawartości audio.
Wdrażanie funkcji zamiany tekstu na mowę z dowolnego miejsca z chmury do brzegu
Uruchamiaj zamianę tekstu na mowę wszędzie tam, gdzie znajdują się Twoje dane. Wbuduj realistyczną syntezę mowy w aplikacjach zoptymalizowanych pod kątem możliwości chmury i lokalizacji na obrzeżach, używając containers.
Tworzenie niestandardowego głosu dla marki
Wyróżnij swoją markę przy użyciu unikatowego, niestandardowego głosu. Opracuj wysoce realistyczny głos na potrzeby bardziej naturalnych interfejsów konwersacyjnych przy użyciu możliwości niestandardowego neuronowego modelu głosu, rozpoczynając od 30-minutowego nagrania audio. Oto kilka przykładów organizacji, które już dziś zajmują się generowaniem głosu przy użyciu sztucznej inteligencji:
Firma Swisscom ulepsza obsługę klienta za pomocą wielojęzycznego asystenta głosowego
Firma Swisscom użyła usługi Mowa, aby utworzyć naturalnie brzmiącego, dostosowanego asystenta głosowego zamiany tekstu na mowę, z osobowościami głosowymi, które są unikatowe dla firmy Swisscom w języku angielskim, francuskim, niemieckim i włoskim.

AT&T zachwyca klientów wciągającymi środowiskami
AT&T prezentuje możliwości swojej sieci 5G z immersyjnym środowiskiem, które umożliwia jej klientom bezpośrednią rozmowę z Bugs Bunny*.
*LOONEY TUNES i wszystkimi powiązanymi znakami i elementami ©™ Warner Bros. Entertainment Inc. (s21)
Firma Progressive udostępnia Flo bezpośrednio swoim klientom
Firma Progressive wykorzystała funkcję niestandardowego neuronowego modelu głosu do stworzenia naturalnie brzmiącej, wirtualnej wersji Flo, aby pomóc swoim klientom we wszystkich sprawach, od uzyskiwania bezpłatnej oferty ubezpieczenia samochodu po ogólne pytania dotyczące ubezpieczenia.
Wspieraj innowacje w aplikacjach dzięki usługom sztucznej inteligencji w chmurze
Poznaj 5 kluczowych sposobów, dzięki którym Twoja organizacja może rozpocząć pracę ze sztuczną inteligencją, aby szybko zrealizować wartość.
Kompleksowa ochrona prywatności i zabezpieczenia
- Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.
- Twoje dane pozostają Twoimi. Dane tekstowe nie są przechowywane podczas przetwarzania danych ani generowania dźwięku.
- Wyświetlaj i usuwaj niestandardowe dane oraz modele syntezowanej mowy w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.
- Wspierana przez infrastrukturę platformy Azure, usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.
Elastyczny cennik zapewnia potrzebną moc i kontrolę
Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za funkcję zamiany tekstu na mowę są naliczane zgodnie z rzeczywistym użyciem, na podstawie liczby znaków przekonwertowanych na dźwięk.
Wytyczne dotyczące tworzenia odpowiedzialnych głosów syntetycznych
Zapoznaj się z informacjami na temat odpowiedzialnego wdrażania
Syntetyczne głosy muszą być zaprojektowany tak, aby budziły zaufanie innych osób. Poznaj zasady tworzenia syntetycznych głosów, które zwiększą wiarygodność Twojej firmy i jej usług.
Uzyskiwanie zgody od aktorów głosowych
Pomóż aktorom głosowym zrozumieć, jak działa neuronowa zamiana tekstu na mowę i uzyskaj informacje na temat zalecanych przypadków użycia.
Działaj przejrzyście
Przejrzystość jest podstawą do odpowiedzialnego korzystania z komputerowych generatorów głosów i głosów syntetycznych. Zadbaj o to, aby użytkownicy mieli świadomość, że słyszą syntetyczny głos, a osoby udostępniające głos miały świadomość w jaki sposób ich głos zostanie wykorzystany. Dowiedz się więcej dzięki naszym wytycznym dotyczącym projektowania ujawniania.
Dokumentacja i zasoby
Eksplorowanie przykładów kodu
Zapoznaj się z przykładowym kodem
Zobacz zasoby dotyczące dostosowywania
Dostosuj rozwiązanie do obsługi mowy za pomocą portalu Speech Studio. Brak konieczności pisania kodu.
Rozwiązania tworzone za pomocą zamiany tekstu na mowę
Firma BBC wprowadza innowacje w zapewnianiu zaufanej zawartości
Firma BBC wykorzystała usługi Azure Cognitive Services i Azure Bot Service do utworzenia kompleksowego, dostosowanego głosowego asystenta cyfrowego, który zapewnia zgodność z tożsamością marki i pomaga utworzyć nową relację konwersacji z szeroką grupą odbiorców.

Firma Swisscom ulepsza obsługę klienta za pomocą wielojęzycznego asystenta głosowego
Firma Swisscom użyła usługi Mowa, aby utworzyć naturalnie brzmiącego, dostosowanego asystenta głosowego z osobowościami głosowymi, które są unikatowe dla firmy Swisscom w języku angielskim, francuskim, niemieckim i włoskim.

Firma Motorola pomaga służbom ratowniczym uzyskać dostęp do najważniejszych danych
Firma Motorola Solutions pomaga funkcjonariuszom policji i innym służbom ratunkowym szybciej uzyskiwać dostęp do ważnych informacji przy użyciu asystenta wirtualnego z dźwiękiem.

Firma Universal Electronics zasila połączone inteligentne domy
Firma Universal Electronics pomaga producentom dostarczać funkcje nawigacji i kontroli z obsługą głosu, które działają na inteligentnych urządzeniach domowych.

Firma Cheetah Mobile rozszerza tłumaczenie międzynarodowe
Cheetah Mobile, mobilna firma internetowa z użytkownikami aplikacji w więcej niż 200 krajach i regionach, korzysta z zamiany tekstu na mowę, aby rozszerzyć dostępność urządzenia i aplikacji tłumaczenia na rynki międzynarodowe.
