Zamiana tekstu na mowę

Konwertuj tekst na realistycznie brzmiącą mowę, aby tworzyć bardziej naturalne interfejsy

Mowa ludzka, a nie mowa robotów

Korzystaj z funkcji zamiany tekstu na mowę w ramach usługi Mowa, aby tworzyć aplikacje i usługi naturalnie komunikujące się z użytkownikiem. Ożywiaj swoje rozwiązania, korzystając z dziesiątek głosów w wielu różnych językach. Twórz realistycznie brzmiące głosy dzięki funkcji neuronowej zamiany tekstu na mowę, opartej na przełomowych badaniach naukowych w zakresie technologii syntezy mowy. Dostosowuj modele, aby opracować unikatowy głos Twojego rozwiązania i Twojej marki.

Realistyczna mowa

Skorzystaj z płynnej, naturalnie brzmiącej mowy, naśladującej wzorce akcentu i intonacji ludzkiego głosu.

Globalny zasięg

Docieraj do odbiorców na całym świecie, korzystając z ponad 80 głosów oraz 45 języków i odmian.

Dostosowane środowisko

Twórz własne, unikatowe głosy dla swoich aplikacji na podstawie zaledwie kilku minut treningowych nagrań.

Zoptymalizowany dźwięk

Precyzyjnie dostosowuj głos w swoich scenariuszach, łatwo regulując takie atrybuty jak szybkość, głośność, czy wymowa.

Generuj naturalnie brzmiącą mowę

Daj nowy głos swoim aplikacjom — wyraźny i z naturalną intonacją, naśladującą ludzką mowę. Dzięki zastosowaniu głębokich sieci neuronowych nasza funkcja zamiany tekstu na mowę sprawia, że komputerowo generowany głos jest ekspresyjny i niemal nieodróżnialny od naturalnego.

Angielski (USA) Jessa

Zdanie Próbka głosu
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Angielski (USA) Guy

Zdanie Próbka głosu
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Chiński (CN): Xiaoxiao

Zdanie Próbka głosu
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Niemiecki (DE): Katja

Zdanie Próbka głosu
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Włoski (IT): Elsa

Zdanie Próbka głosu
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Chcesz to skompilować?

Docieraj do odbiorców na całym świecie w czasie rzeczywistym

Konwertuj tekst na dźwięk w czasie rzeczywistym, tworząc płynne środowisko konwersacji. Angażuj odbiorców na całym świecie, korzystając z ponad 80 głosów oraz 45 języków i odmian.

Język Przykładowy tekst Próbka głosu
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Chcesz to skompilować?

Opracuj unikatowy głos Twojej marki

Opracuj swój unikatowy głos, nie używając ani jednego wiersza kodu, na podstawie zaledwie kilku minut treningowego dźwięku. Skorzystaj z modeli głębokiej sieci neuronowej dostępnych w ramach niestandardowego neuronowego modelu głosu, aby opracować bardzo realistyczny i naturalny głos niestandardowy, którego możesz używać w scenariuszach syntezy mowy w czasie rzeczywistym oraz do syntezy długich nagrań dźwiękowych.

Język

Jakość

Przykładowy tekst Próbka głosu

Chcesz rozpocząć tworzenie własnego modelu głosowego?

Łatwo dostosowuj wyjściowy dźwięk

Możesz precyzyjnie dostosowywać wynik zamiany tekstu na mowę w czasie rzeczywistym, regulując parametry takie jak szybkość, wymowa, wysokość dźwięku, głośność, intonacja czy pauzy. Neuronowe modele głosu umożliwiają dostosowanie stylu mówienia do wyrażanych emocji, takich jak radość czy współczucie, albo do konkretnych sytuacji — na przykład dobranie swobodnego tonu do zwykłej pogawędki lub poważnego tonu do prezentowania wiadomości.

Dowiedz się więcej na temat dostosowywania głosu

Wdrażanie z dowolnego miejsca z chmury do brzegu

Uruchamiaj zamianę tekstu na mowę za pomocą kontenerów w chmurze lub lokalnie, gdy najważniejsze jest bezpieczeństwo danych i niskie opóźnienie. Kontenery usługi Mowa obsługują teraz głosy standardowe i niestandardowe.

Dowiedz się więcej o usłudze Mowa w kontenerach

Zabezpieczenia dla przedsiębiorstwa

  • Firma Microsoft inwestuje ponad USD 1 billion rocznie w badania i rozwiązania z zakresu cyberbezpieczeństwa.

  • Zatrudniamy ponad 3500 ekspertów w dziedzinie zabezpieczeń, którzy są w pełni skoncentrowani na ochronie danych i prywatności.

  • Platforma Azure ma więcej certyfikatów w porównaniu z innymi dostawcami usług w chmurze. Wyświetl pełną listę.

Uzyskaj potrzebną Ci moc, kontrolę i dostosowania w elastycznych cenach

Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za funkcję zamiany tekstu na mowę są naliczane zgodnie z rzeczywistym użyciem, na podstawie liczby znaków przekonwertowanych na dźwięk.

Wskazówki dotyczące odpowiedzialnego korzystania z głosów neuronowych

Zapoznaj się z informacjami na temat odpowiedzialnego wdrażania syntetycznych głosów

Syntetyczny głos musi być zaprojektowany tak, aby budził zaufanie. Poznaj zasady tworzenia syntetycznych głosów, które zwiększą wiarygodność Twojej firmy i jej usług.

Przeczytaj nasze wskazówki dotyczące odpowiedzialnego wdrażania

Uzyskiwanie zgody od aktorów głosowych

Pomóż aktorom głosowym zrozumieć, jak działa neuronowa zamiana tekstu na mowę i jak może być używana po zakończeniu procesu nagrywania dźwięku.

Przeczytaj nasze wskazówki dotyczące ujawniania informacji aktorom głosowym

Działaj przejrzyście

Zadbaj o to, aby użytkownicy mieli świadomość, że słyszą syntetyczny głos, a aktorzy głosowi — w jaki sposób ich głos zostanie wykorzystany.

Zobacz nasze wskazówki dotyczące ujawniania informacji Dowiedz się więcej na temat naszego odpowiedzialnego podejścia

Skontaktuj się z nami

Funkcja niestandardowego neuronowego modelu głosu jest w ograniczonej wersji zapoznawczej. Więcej informacji na temat ograniczeń i sposobu uzyskania dostępu znajdziesz tutaj.

Rozpocznij pracę z zamianą tekstu na mowę w trzech krokach

Uzyskaj błyskawiczny dostęp i środki w wysokości $200, tworząc bezpłatne konto platformy Azure.
Zaloguj się do witryny Azure Portal i dodaj usługę Mowa.
Dowiedz się, jak osadzić funkcję zamiany tekstu na mowę, korzystając z przewodników Szybki start i dokumentacji.

Zamiana tekstu na mowę — zasoby dla deweloperów

Kursy

Skorzystaj z kursu firmy Pluralsight, przedstawiającego korzystanie z zamiany tekstu na mowę krok po kroku.

Weź udział w kursie

Często zadawane pytania dotyczące zamiany tekstu na mowę

  • Głosy standardowe są tworzone przy użyciu technik syntezy statystyczno-parametrycznej i konkatenacyjnej. Mają one wyraźne i naturalne brzmienie i można je stosować w aplikacjach do komunikacji w ponad 45 językach, korzystając z szerokiej gamy opcji.

    Głosy neuronowe pozwalają pokonać ograniczenia tradycyjnych systemów zamiany tekstu na mowę dzięki zastosowaniu głębokich sieci neuronowych w celu dopasowania wzorców akcentu i intonacji do języka mówionego oraz komputerowego syntetyzowania jednostek mowy. Podczas standardowej zamiany tekstu na mowę prozodia jest dzielona na części do celów analizy językowej i przewidywania akustycznego, do których stosowane są oddzielne modele. Efektem może być niedoskonała synteza głosu. W przypadku naszej funkcji syntezy neuronowej przewidywanie prozodii i synteza głosu odbywają się jednocześnie, dzięki czemu głos jest bardziej płynny i naturalny.
  • Pełną listę zawiera dokumentacja.
  • Sprawdź dostępność w regionach.

Rozpocznij pracę z zamianą tekstu na mowę