Zamiana tekstu na mowę

A Speech service feature that converts text to lifelike speech

Ożywianie aplikacji za pomocą naturalnie brzmiących głosów

Twórz aplikacje i usługi komunikujące się z użytkownikiem w naturalny sposób, wybierając spośród ponad 110 głosów w ponad 45 językach i odmianach. Wyróżnij swoją markę za pomocą niestandardowego głosu i uzyskaj dostęp do głosów o różnych stylach mówienia i tonach emocjonalnych, aby dopasować je do przypadku użycia — wszystko to w preferowanym języku programowania.

Realistyczna mowa

Skorzystaj z płynnej, naturalnie brzmiącej mowy, naśladującej wzorce i intonację ludzkiego głosu.

Dostosowywalne głosy

Utwórz unikatowy głos, który odzwierciedla tożsamość marki.

Precyzyjne kontrolki audio

Dostosowuj głos w swoich scenariuszach, łatwo regulując szybkość, wysokość, wymowę, pauzy i wiele więcej.

Elastyczne wdrożenia

Uruchamiaj zamianę tekstu na mowę w dowolnym miejscu — w chmurze lub na urządzeniach brzegowych w kontenerach.

Uzyskaj dostęp do wielu różnych głosów dla każdego scenariusza

Angażuj odbiorców na całym świecie, korzystając z ponad 110 głosów oraz 45 języków i odmian. Ożyw swoje scenariusze, korzystając z niezwykle ekspresyjnych i ludzkich głosów. Neuronowa zamiana tekstu na mowę obsługuje kilka stylów mowy, w tym czat, odczyt wiadomości i obsługą klienta oraz emocje, takie jak wesołość czy empatia.

Wypróbuj funkcję zamiany tekstu na mowę za pomocą tej aplikacji demonstracyjnej utworzonej na podstawie naszego zestawu JavaScript SDK

Uwaga: Dane nie będą przechowywane.

Kontroluj więcej aspektów danych wyjściowych funkcji zamiany tekstu na mowę przy użyciu narzędzia do tworzenia zawartości audio

Dowiedz się, jak to utworzyć

Uwaga: Dane nie będą przechowywane.

Kontroluj więcej aspektów danych wyjściowych funkcji zamiany tekstu na mowę przy użyciu narzędzia do tworzenia zawartości audio

Dowiedz się, jak to utworzyć

Tworzenie niestandardowego głosu dla marki

Wyróżnij swoją markę przy użyciu unikatowego, niestandardowegogłosu. Opracuj wysoce realistyczny głos na potrzeby bardziej naturalnych interfejsów konwersacyjnych przy użyciu niestandardowego neuronowego modelu głosu (wersja zapoznawcza), rozpoczynając od 30 minut nagrania audio.

Język

Jakość

Przykładowy tekst Próbka głosu

Chcesz rozpocząć tworzenie własnego modelu głosowego?

Dostosowywanie głosowych danych wyjściowych

Dostosuj dźwięk, aby pasował do danego scenariusza. Definiuj leksykony i kontroluj parametry mowy, takie jak wymowa, wysokość, szybkość, pauzy i intonacja przy użyciu języka znaczników syntezy mowy (SSML, Speech Synthesis Markup Language) lub za pomocą narzędzia do tworzenia zawartości audio.

Wdrażanie z dowolnego miejsca z chmury do brzegu

Uruchamiaj zamianę tekstu na mowę wszędzie tam, gdzie znajdują się dane. Twórz aplikacje mowy, które są zoptymalizowane pod kątem zarówno niezawodnych funkcji chmury, jak i lokalnego charakteru urządzeń brzegowych, przy użyciu kontenerów (wersja zapoznawcza). Kontenery usługi Mowa obsługują głosy standardowe i niestandardowe.

Kompleksowa ochrona prywatności i zabezpieczenia

  • Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.
  • Twoje dane pozostają Twoimi. Dane tekstowe nie są przechowywane podczas przetwarzania danych ani generowania dźwięku.
  • Wyświetlaj i usuwaj niestandardowe dane oraz modele głosowe w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.
  • Wspierana przez infrastrukturę platformy Azure, usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.

Elastyczny cennik zapewnia potrzebną moc i kontrolę

Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za funkcję zamiany tekstu na mowę są naliczane zgodnie z rzeczywistym użyciem, na podstawie liczby znaków przekonwertowanych na dźwięk.

Wytyczne dotyczące tworzenia odpowiedzialnych głosów syntetycznych

Dokumentacja i zasoby

Rozpocznij

Przeczytaj naszą dokumentacją

Weź udział w kursie Microsoft Learning

Eksplorowanie przykładów kodu

Zapoznaj się z naszym przykładowym kodem

Zobacz zasoby dotyczące dostosowywania

Dostosuj rozwiązanie do obsługi mowy za pomocą portalu Speech Studio. Brak konieczności pisania kodu.

Rozwiązania tworzone za pomocą zamiany tekstu na mowę

Firma Motorola pomaga służbom ratowniczym uzyskać dostęp do najważniejszych danych

Firma Motorola Solutions pomaga funkcjonariuszom policji i innym służbom ratunkowym szybciej uzyskiwać dostęp do ważnych informacji przy użyciu asystenta wirtualnego z dźwiękiem.

Przeczytaj historię

Motorola Solutions

Firma BBC wprowadza innowacje w zapewnianiu zaufanej zawartości

Korzystając z usług Azure Cognitive Services i Azure Bot Service, firma BBC utworzyła kompleksowego, dostosowanego głosowego asystenta cyfrowego, który zapewnia zgodność z tożsamością marki i pomaga utworzyć nową relację konwersacji z szeroką grupą odbiorców.

Przeczytaj historię

BBC

Firma Universal Electronics zasila połączone inteligentne domy

Firma Universal Electronics pomaga producentom dostarczać funkcje nawigacji i kontroli z obsługą głosu, które działają na inteligentnych urządzeniach domowych.

Przeczytaj historię

Universal Electronics

Firma Cheetah Mobile rozszerza tłumaczenie międzynarodowe

Cheetah Mobile, mobilna firma internetowa z użytkownikami aplikacji w więcej niż 200 krajach i regionach, korzysta z zamiany tekstu na mowę, aby rozszerzyć dostępność urządzenia i aplikacji tłumaczenia na rynki międzynarodowe.

Przeczytaj historię

Cheetah Mobile

Rozpocznij pracę z usługą Mowa