Pomiń nawigację

Zamiana tekstu na mowę

Ożywianie aplikacji za pomocą naturalnie brzmiących głosów

Twórz aplikacje oraz usługi, które mówią naturalnie, wybierając spośród ponad 270 neuronowych głosów oraz ponad 119 języków i wariantów. Wyróżnij swoją markę za pomocą dostosowanego, realistycznego głosu i uzyskaj dostęp do głosów z różnymi stylami mówienia i tonami emocjonalnymi, aby dopasować je do twojego przypadku użycia — od czytników tekstu po czatboty pomocy technicznej.

Realistyczna mowa zsyntetyzowana

Skorzystaj z płynnej, naturalnie brzmiącej funkcji zamiany tekstu na mowę, naśladującej intonację ludzkiego głosu.

Dostosowywalne głosy osób wymawiających tekst

Utwórz unikatowy generator głosu sztucznej inteligencji, który odzwierciedla tożsamość marki.

Precyzyjne kontrolki dźwięku zamiany tekstu na mowę

Dostosowuj głos w swoich scenariuszach, łatwo regulując szybkość, wysokość, wymowę, pauzy i wiele więcej.

Elastyczne wdrożenia

Uruchamiaj zamianę tekstu na mowę w dowolnym miejscu — w chmurze, w środowisku lokalnym lub na urządzeniach brzegowych w kontenerach.

Uzyskaj dostęp do wielu różnych głosów dla każdego scenariusza

Zaangażuj odbiorców globalnych przy użyciu ponad 330 głosów neuronowych w 129 językach i wariantach. Ożyw swoje scenariusze, takie jak czytniki tekstu i asystenci z obsługą głosu, dzięki głosom bardzo ekspresyjnym i ludzkim. Neuronowa zamiana tekstu na mowę obsługuje kilka stylów mówienia, w tym emisję wiadomości, obsługę klienta, krzyczenie, szeptanie oraz emocje, takie jak radość i smutek.

Wypróbuj funkcję zamiany tekstu na mowę za pomocą tej aplikacji demonstracyjnej utworzonej na podstawie naszego zestawu JavaScript SDK

Uwaga: Dane nie będą przechowywane.

Dowiedz się, jak to utworzyć

Uwaga: Dane nie będą przechowywane.

Dowiedz się, jak to utworzyć

Dostosowywanie głosowych danych wyjściowych

Precyzyjnie dostosuj syntetyzowaną mowę, aby pasowała do scenariusza. Zdefiniuj leksykony i steruj parametrami mowy, takimi jak wymowa, wysokość, szybkość, pauzy i intonacja za pomocą języka Speech Synthesis Markup Language (SSML) lub za pomocą narzędzia do tworzenia zawartości audio.

Wdrażanie funkcji zamiany tekstu na mowę z dowolnego miejsca z chmury do brzegu

Uruchamiaj zamianę tekstu na mowę wszędzie tam, gdzie znajdują się Twoje dane. Wbuduj realistyczną syntezę mowy w aplikacjach zoptymalizowanych pod kątem możliwości chmury i lokalizacji na obrzeżach, używając containers.

Tworzenie niestandardowego głosu dla marki

Wyróżnij swoją markę przy użyciu unikatowego, niestandardowego głosu. Opracuj wysoce realistyczny głos na potrzeby bardziej naturalnych interfejsów konwersacyjnych przy użyciu możliwości niestandardowego neuronowego modelu głosu, rozpoczynając od 30-minutowego nagrania audio. Oto kilka przykładów organizacji, które już dziś zajmują się generowaniem głosu przy użyciu sztucznej inteligencji:

Firma Swisscom ulepsza obsługę klienta za pomocą wielojęzycznego asystenta głosowego

Firma Swisscom użyła usługi Mowa, aby utworzyć naturalnie brzmiącego, dostosowanego asystenta głosowego zamiany tekstu na mowę, z osobowościami głosowymi, które są unikatowe dla firmy Swisscom w języku angielskim, francuskim, niemieckim i włoskim.

Przeczytaj historię

AT&T zachwyca klientów wciągającymi środowiskami

AT&T prezentuje możliwości swojej sieci 5G z immersyjnym środowiskiem, które umożliwia jej klientom bezpośrednią rozmowę z Bugs Bunny*.

*LOONEY TUNES i wszystkimi powiązanymi znakami i elementami ©™ Warner Bros. Entertainment Inc. (s21)

Obejrzyj film

Firma Progressive udostępnia Flo bezpośrednio swoim klientom

Firma Progressive wykorzystała funkcję niestandardowego neuronowego modelu głosu do stworzenia naturalnie brzmiącej, wirtualnej wersji Flo, aby pomóc swoim klientom we wszystkich sprawach, od uzyskiwania bezpłatnej oferty ubezpieczenia samochodu po ogólne pytania dotyczące ubezpieczenia.

Przeczytaj historię

Wspieraj innowacje w aplikacjach dzięki usługom sztucznej inteligencji w chmurze

Poznaj 5 kluczowych sposobów, dzięki którym Twoja organizacja może rozpocząć pracę ze sztuczną inteligencją, aby szybko zrealizować wartość.

Kompleksowa ochrona prywatności i zabezpieczenia

  • Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.
  • Twoje dane pozostają Twoimi. Dane tekstowe nie są przechowywane podczas przetwarzania danych ani generowania dźwięku.
  • Wyświetlaj i usuwaj niestandardowe dane oraz modele syntezowanej mowy w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.
  • Wspierana przez infrastrukturę platformy Azure, usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.

Elastyczny cennik zapewnia potrzebną moc i kontrolę

Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za funkcję zamiany tekstu na mowę są naliczane zgodnie z rzeczywistym użyciem, na podstawie liczby znaków przekonwertowanych na dźwięk.

Wytyczne dotyczące tworzenia odpowiedzialnych głosów syntetycznych

Zapoznaj się z informacjami na temat odpowiedzialnego wdrażania

Syntetyczne głosy muszą być zaprojektowany tak, aby budziły zaufanie innych osób. Poznaj zasady tworzenia syntetycznych głosów, które zwiększą wiarygodność Twojej firmy i jej usług.

Uzyskiwanie zgody od aktorów głosowych

Pomóż aktorom głosowym zrozumieć, jak działa neuronowa zamiana tekstu na mowę i uzyskaj informacje na temat zalecanych przypadków użycia.

Działaj przejrzyście

Przejrzystość jest podstawą do odpowiedzialnego korzystania z komputerowych generatorów głosów i głosów syntetycznych. Zadbaj o to, aby użytkownicy mieli świadomość, że słyszą syntetyczny głos, a osoby udostępniające głos miały świadomość w jaki sposób ich głos zostanie wykorzystany. Dowiedz się więcej dzięki naszym wytycznym dotyczącym projektowania ujawniania.

Dokumentacja i zasoby

Eksplorowanie przykładów kodu

Zapoznaj się z przykładowym kodem

Zobacz zasoby dotyczące dostosowywania

Dostosuj rozwiązanie do obsługi mowy za pomocą portalu Speech Studio. Brak konieczności pisania kodu.

Rozwiązania tworzone za pomocą zamiany tekstu na mowę

Firma BBC wprowadza innowacje w zapewnianiu zaufanej zawartości

Firma BBC wykorzystała usługi Azure Cognitive Services i Azure Bot Service do utworzenia kompleksowego, dostosowanego głosowego asystenta cyfrowego, który zapewnia zgodność z tożsamością marki i pomaga utworzyć nową relację konwersacji z szeroką grupą odbiorców.

BBC

Firma Swisscom ulepsza obsługę klienta za pomocą wielojęzycznego asystenta głosowego

Firma Swisscom użyła usługi Mowa, aby utworzyć naturalnie brzmiącego, dostosowanego asystenta głosowego z osobowościami głosowymi, które są unikatowe dla firmy Swisscom w języku angielskim, francuskim, niemieckim i włoskim.

Swisscom

Firma Motorola pomaga służbom ratowniczym uzyskać dostęp do najważniejszych danych

Firma Motorola Solutions pomaga funkcjonariuszom policji i innym służbom ratunkowym szybciej uzyskiwać dostęp do ważnych informacji przy użyciu asystenta wirtualnego z dźwiękiem.

Motorola Solutions

Firma Universal Electronics zasila połączone inteligentne domy

Firma Universal Electronics pomaga producentom dostarczać funkcje nawigacji i kontroli z obsługą głosu, które działają na inteligentnych urządzeniach domowych.

Universal Electronics

Firma Cheetah Mobile rozszerza tłumaczenie międzynarodowe

Cheetah Mobile, mobilna firma internetowa z użytkownikami aplikacji w więcej niż 200 krajach i regionach, korzysta z zamiany tekstu na mowę, aby rozszerzyć dostępność urządzenia i aplikacji tłumaczenia na rynki międzynarodowe.

Cheetah Mobile

Wszystko gotowe — skonfigurujmy bezpłatne konto platformy Azure