Przejdź do głównej zawartości

Zamiana tekstu na mowę

Funkcja usługi Mowa, która konwertuje tekst na realistycznie brzmiącą mowę.

Ożyw swoje aplikacje dzięki naturalnie brzmiącym głosom

Twórz aplikacje i usługi, które mówią w sposób naturalny. Wyróżnij swoją markę dzięki dostosowanemu, realistycznemu generatorowi głosu i uzyskaj dostęp do głosów o różnych stylach mówienia i tonach emocjonalnych, aby dopasować je do danego przypadku użycia — od czytników tekstu i rozmówców po boty obsługi klienta.

Realistyczna mowa zsyntetyzowana

Umożliwiaj płynne, naturalnie brzmiące zamiany tekstu na mowę, które odpowiadają intonacji i emocjom ludzkich głosów.

Dostosowywalne głosy osób wymawiających tekst

Stwórz unikalny generator głosu sztucznej inteligencji, który odzwierciedla tożsamość Twojej marki.

Precyzyjne kontrolki dźwięku zamiany tekstu na rozmowę

Dostosowuj głos w swoich scenariuszach, łatwo regulując szybkość, wysokość, wymowę, pauzy i wiele więcej.

Elastyczne wdrażanie

Uruchamiaj zamianę tekstu na mowę w dowolnym miejscu — w chmurze, w środowisku lokalnym lub na urządzeniach brzegowych w kontenerach.

Dostosowywanie głosowych danych wyjściowych

Dostosuj dźwięk syntezowanej mowy, aby pasował do danego scenariusza. Definiuj leksykony i kontroluj parametry mowy, takie jak wymowa, wysokość, tempo, pauzy i intonacja przy użyciu  języka znaczników syntezy mowy (SSML, Speech Synthesis Markup Language) lub za pomocą narzędzia do tworzenia zawartości audio.

Wdrażaj funkcje zamiany tekstu na mowę w dowolnym miejscu, od chmury po Edge

Uruchamiaj zamianę tekstu na mowę wszędzie tam, gdzie znajdują się dane. Wbuduj realistyczną syntezę mowy w aplikacje zoptymalizowane pod kątem zarówno niezawodnych funkcji chmury, jak i lokalnego charakteru urządzeń brzegowych, przy użyciu kontenerów.

Twórz niestandardowy głos dla swojej marki

Wyróżnij swoją markę przy użyciu unikatowego,niestandardowego głosu. Opracuj wysoce realistyczny głos na potrzeby bardziej naturalnych interfejsów konwersacyjnych przy użyciu funkcji niestandardowego neuronowego modelu głosu, rozpoczynając od 30 minut nagrania audio. Oto kilka przykładów organizacji, które obecnie generują głos sztucznej inteligencji:

Napędzanie innowacji w zakresie aplikacji za pomocą usług sztucznej inteligencji w chmurze

Poznaj 5 najważniejszych sposobów, za pomocą których Twoja organizacja może zacząć korzystać ze sztucznej inteligencji w celu szybkiego przekonania się o jej wartości.

Kompleksowa ochrona prywatności i zabezpieczenia

Dokumentacja

Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.

Wyświetlaj i usuwaj niestandardowe dane oraz modele syntezowanej mowy w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.

Szkolenie

Twoje dane pozostaną Twoje. Twoje dane tekstowe nie są przechowywane podczas przetwarzania danych lub generowania głosu audio.

Wspierana przez infrastrukturę platformy Azure, usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.

Kompleksowe zabezpieczenia i zgodność, wbudowane

  • Firma Microsoft inwestuje ponad 1 mld USD rocznie w badania i rozwiązania z zakresu cyberbezpieczeństwa.

Ogólny widok centrum zabezpieczeń na platformie Azure przedstawiający zasady, zgodność danych oraz higienę bezpieczeństwa zasobów
  • Zatrudniamy ponad 3500 ekspertów w dziedzinie zabezpieczeń, którzy koncentrują się na ochronie danych i prywatności.

Karta obliczeń i aplikacji w Centrum zabezpieczeń na platformie Azure z listą zaleceń
  • Platforma Azure ma więcej certyfikatów niż jakikolwiek inny dostawca usług w chmurze. Wyświetl kompleksową listę.

  • Elastyczne ceny zapewniają potrzebną moc i kontrolę

    Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za funkcję zamiany tekstu na mowę są naliczane zgodnie z rzeczywistym użyciem, na podstawie liczby znaków przekonwertowanych na dźwięk.

Zacznij korzystać z bezpłatnego konta platformy Azure

1

Rozpocznij bezpłatnie. Uzyskaj środki w wysokości 200 USD do wykorzystania w ciągu 30 dni. Mając środki, otrzymasz bezpłatne przydziały dla wielu naszych najpopularniejszych usług, a dodatkowo otrzymasz bezpłatne przydziały dla ponad 55 innych usług, które zawsze są bezpłatne.

2

Po wykorzystaniu środków przejdź na płatność zgodnie z rzeczywistym użyciem, aby kontynuować pracę z użyciem tych samych bezpłatnych usług. Płacisz tylko wtedy, gdy użycie przekroczy bezpłatne miesięczne przydziały.

3

Po upływie 12 miesięcy będziesz nadal mieć dostęp do ponad 55 bezpłatnych usług — i nadal będziesz płacić tylko za wykorzystanie przekraczające bezpłatne miesięczne przydziały.

Wytyczne dotyczące tworzenia odpowiedzialnych głosów syntetycznych

Zapoznaj się z informacjami na temat odpowiedzialnego wdrażania

Syntetyczny głos musi być zaprojektowany tak, aby budził zaufanie. Poznaj zasady budowania syntetyzowanych głosów, które budują zaufanie do Twojej firmy i usług.

Uzyskuj zgody od aktorów głosowych

Pomóż aktorom głosowym zrozumieć, jak działa neuronowa zamiana tekstu na mowę i uzyskaj informacje na temat zalecanych przypadków użycia.

Działaj przejrzyście

Przejrzystość jest podstawą odpowiedzialnego korzystania z komputerowych generatorów głosu i głosów syntetycznych. Zadbaj o to, aby użytkownicy mieli świadomość, że słyszą syntetyczny głos, a aktorzy głosowi — w jaki sposób ich głos zostanie wykorzystany. Dowiedz się więcej dzięki naszym wytycznym dotyczącym projektowania ujawniania.

Dokumentacja i zasoby

Wprowadzenie

Eksploruj przykłady kodu

Zapoznaj się z przykładowym kodem

Zobacz zasoby dotyczące dostosowywania

Dostosuj rozwiązanie do obsługi mowy za pomocą Speech Studio. Brak konieczności pisania kodu.

Rozpocznij tworzenie przy użyciu usług Cognitive Services

Wypróbuj bezpłatnie zamianę tekstu na mowę