Mowa platformy Azure AI
Usługa zarządzana oferująca najlepsze w branży funkcje mowy, takie jak zamiana mowy na tekst, zamiana tekstu na mowę, tłumaczenie mowy i rozpoznawanie osoby mówiącej.
Szybko twórz wysokiej jakości aplikacje z obsługą głosu
Twórz niezawodnie i szybko aplikacje z obsługą głosu generatywnej AI za pomocą usługi Mowa platformy Azure AI. Transkrybuj mowę na tekst z wysoką dokładnością, twórz naturalnie brzmiące głosy zamiany tekstu na mowę, tłumacz dźwięk mowy i używaj rozpoznawania osoby mówiącej podczas konwersacji. Twórz szybciej przy użyciu wstępnie utworzonych i dostosowywalnych modeli sztucznej inteligencji na platformie Studio AI platformy Azure.
Najwyższa jakość w branży
Uzyskaj najnowocześniejsze funkcje zamiany mowy na tekst, realistycznej zamiany tekstu na mowę i nagradzanego rozpoznawania osoby mówiącej.
Zgodność i bezpieczeństwo
Twoje dane pozostają pod Twoją kontrolą — dane wejściowe mowy nie są rejestrowane podczas przetwarzania.
Dostosowywalne głosy i modele
Twórz niestandardowe głosy, dodawaj określone słowa do podstawowego słownika lub twórz własne modele.
Elastyczne wdrażanie
Uruchamiaj usługę Mowa w dowolnym miejscu, w chmurze lub na urządzeniach brzegowych w kontenerach.
Konwersja mowy na tekst
Szybko i dokładnie twórz transkrypcje dźwięku w ponad 100 językach i odmianach. Zbieraj szczegółowe informacje o klientach dzięki transkrypcjom w centrach telefonicznej obsługi klienta, ulepszaj środowiska za pomocą asystentów głosowych, zapisuj kluczowe dyskusje podczas spotkań itd.
Pozwól aplikacji przemówić
Używaj zamiany tekstu na mowę, aby tworzyć aplikacje i usługi, które mówią konwersacyjnie. Twórz naturalnie brzmiące treści audio, zwiększaj możliwości ułatwień dostępu za pomocą funkcji czytania na głos i twórz niestandardowych asystentów głosowych.
Tłumacz mowę w czasie rzeczywistym
Tłumacz dźwięk z ponad 30 języków i dostosowuj tłumaczenia do specyficznych terminów używanych w organizacji — to wszystko w preferowanym języku programowania.
Weryfikowanie i rozpoznawanie osób mówiących
Potwierdź tożsamość osoby lub rozpoznaj osoby mówiące na spotkaniu, dodając do aplikacji funkcje weryfikacji i identyfikacji osoby mówiącej.
Uaktywniaj asystenta lub urządzenie IoT przy użyciu niestandardowego słowa kluczowego
Utwórz niestandardowe słowo kluczowe dla urządzeń IoT i asystentów głosowych, aby wyróżnić swoją markę, czyniąc ją bardziej osobistą, ujmującą i bezpieczniejszą.
Dodaj polecenia głosowe na potrzeby scenariuszy niewymagających użycia rąk
Utwórz bezdotykowe, przede wszystkim głosowe środowisko, aby zwiększyć bezpieczeństwo i zapewnić obsługę scenariuszy po urlopie.
Kompleksowe Zabezpieczenia i zgodność, wbudowane
-
Firma Microsoft inwestuje ponad 1 mld USD rocznie w badania i rozwiązania z zakresu cyberbezpieczeństwa.
-
Zatrudniamy ponad 3500 ekspertów w dziedzinie zabezpieczeń, którzy są skoncentrowani na ochronie danych i prywatności.
-
Elastyczne ceny zapewniają potrzebną moc i kontrolę
Płać wyłącznie za rzeczywiste użycie, bez kosztów ponoszonych z góry. Płać za usługę Mowa zgodnie z rzeczywistym użyciem na podstawie następujących elementów:
- Liczba godzin transkrypcji lub tłumaczenia dźwięku w przypadku funkcji zamiany mowy na tekst i tłumaczenia mowy.
- Liczba znaków konwertowanych na dźwięk w przypadku zamiany tekstu na mowę
- Liczba transakcji w przypadku rozpoznawania osoby mówiącej
Rozpocznij pracę przy użyciu bezpłatnego konta platformy Azure
1
Rozpocznij bezpłatnie. Uzyskaj środki w wysokości 200 USD do wykorzystania w ciągu 30 dni. Oprócz środków dostaniesz bezpłatne przydziały wielu naszych najpopularniejszych usług oraz bezpłatne przydziały w ponad 55 innych usługach, które są zawsze bezpłatne.
2
Po wykorzystaniu środków przejdź na płatność zgodnie z rzeczywistym użyciem, aby kontynuować pracę z użyciem tych samych bezpłatnych usług. Płacisz tylko wtedy, gdy Twoje użycie przekroczy bezpłatne miesięczne przydziały.
3
Zaufanie firm każdej wielkości
AT&T zachwyca klientów środowiskami immersyjnymi
Firma AT&T prezentuje swoją sieć 5G za pomocą środowiska immersyjnego, które pozwala klientom rozmawiać bezpośrednio z Królikiem Bugsem.*
*LOONEY TUNES i wszystkie powiązane postaci i elementy © & ™ Warner Bros. Entertainment Inc. (s21)
Firma Progressive udostępnia Flo bezpośrednio swoim klientom
Firma Progressive wykorzystała funkcję niestandardowego neuronowego modelu głosu do stworzenia naturalnie brzmiącej, wirtualnej wersji Flo, aby pomóc swoim klientom we wszystkich sprawach, od uzyskiwania bezpłatnej oferty ubezpieczenia samochodu po ogólne pytania dotyczące ubezpieczeń.
Firma KPMG usprawnia transkrypcję rozmów
Firma KPMG używa funkcji zamiany mowy na tekst do transkrypcji i katalogowania tysięcy rozmów, zmniejszając koszty dotyczące przestrzegania przepisów o 80% dla swoich klientów.
Firma Motorola pomaga służbom ratowniczym uzyskać dostęp do najważniejszych danych
Firma Motorola Solutions pomaga służbom ratowniczym w terenie uzyskać dostęp do najważniejszych danych za pomocą głosowego asystenta wirtualnego.
Mowa — dokumentacja i zasoby
Wprowadzenie do usługi Mowa platformy Azure AI
Przeglądaj dokumentację
Weź udział w kursie Microsoft Learn Speech
Zapoznaj się z popularnymi zasobami dla deweloperów
Wypróbuj naszą próbkę kodu i zestawy SDK
Szybkie tworzenie modeli mowy za pomocą przepełnienia stosu usługi Speech Studio