Pomiń nawigację

Usługi mowy

Konwertowanie dźwięku na tekst, wykonywanie tłumaczenia mowy i zamiana mowy na tekst przy użyciu ujednoliconych usług mowy

Szybko twórz wysokiej jakości aplikacje obsługujące głos

Bezpiecznie i szybko twórz aplikacje obsługujące głos dzięki zestawowi Speech SDK. Transkrybuj zamianę mowy na tekst z dużą dokładnością, twórz brzmiące naturalnie głosy zamiany tekstu na mowę, tłumacz dźwięk mówiony i używaj rozpoznawania mówcy podczas rozmów. Odkrywaj bez użycia kodu i twórz modele niestandardowe dostosowane do Twojej aplikacji za pomocą usługi Speech Studio.

Wiodąca w branży jakość

Pobierz najnowocześniejsze funkcje zamiany mowy na tekst, realistyczny tekst na mowę i nagradzane rozpoznawanie osoby mówiącej.

Zgodne i bezpieczne

Twoje dane pozostają Twoje — dane wejściowe mowy nie są rejestrowane podczas przetwarzania.

Dostosowywalne głosy i modele

Tworzenie głosów niestandardowych, dodawanie określonych wyrazów do słownictwa podstawowego lub tworzenie własnych modeli.

Elastyczne wdrożenia

Uruchamiaj usługę Mowa w dowolnym miejscu, w chmurze lub na urządzeniach brzegowych, używając do tego kontenerów.

Konwertowanie mowy na tekst

Szybko i dokładnie transkrybuj dźwięk w ponad 100 językach i wariantach. Zdobądź informacje o kliencie dzięki transkrypcji w call center, popraw doświadczenia asystentów obsługujących głos, uchwyć kluczowe dyskusje podczas spotkań i nie tylko.

Nadaj głos swojej aplikacji

Używaj zamiany tekstu na mowę, aby tworzyć aplikacje i usługi mówiące konwersacyjnie. Twórz brzmiącą naturalnie zawartość audio, zwiększaj dostępność za pomocą funkcji czytania na głos i twórz niestandardowych asystentów głosowych.

Tłumaczenie mowy w czasie rzeczywistym

Przetłumacz dźwięk z ponad 30 języków i dostosuj tłumaczenia dla określonych terminów organizacji — wszystko to w preferowanym języku programowania.

Weryfikuj i rozpoznawaj osoby mówiące

Potwierdź tożsamość osoby lub rozpoznaj, kto mówi na spotkaniu, dodając weryfikację osoby mówiącej i jej identyfikację do aplikacji.

Aktywuj asystenta lub urządzenie IoT za pomocą niestandardowego słowa kluczowego

Utwórz niestandardowe słowo kluczowe dla urządzeń IoT i asystentów z obsługą głosu, aby wyróżnić swoją markę — dzięki czemu będzie bardziej osobista, spersonalizowana i bezpieczna.

Dodaj polecenia głosowe dla scenariuszy bez użycia rąk

Twórz bezdotykowe środowisko oparte na głosie, aby zwiększyć bezpieczeństwo i obsługiwać scenariusze powrotu do pracy.

Wbudowane funkcje kompleksowych zabezpieczeń i zgodności

  • Firma Microsoft inwestuje ponad miliard dolarów ($1mld) rocznie w badania i rozwiązania w zakresie cyberbezpieczeństwa.

  • Zatrudniamy ponad 3,500 ekspertów w dziedzinie zabezpieczeń, którzy są skoncentrowani na ochronie danych i prywatności.

  • Platforma Azure ma więcej certyfikatów w porównaniu z innymi dostawcami usług w chmurze. Wyświetl pełną listę.

Elastyczny cennik zapewnia potrzebną moc i kontrolę

Płać tylko za to, czego używasz, bez ponoszenia kosztów z góry. Dzięki funkcji Mowa, płać zgodnie z rzeczywistym użyciem na podstawie:

  • Liczba godzin transkrypcji lub tłumaczenia dźwięku na mowę na tekst i tłumaczenie mowy.
  • Liczba znaków konwertowania na dźwięk w zamianie tekstu na mowę
  • Liczba transakcji dla rozpoznawania osoby mówiącej

Dokumentacja i zasoby usługi Mowa

Wprowadzenie do usług mowy

Przejrzyj dokumentację

Weź udział w kursie Microsoft Learn poświęconym usłudze Mowa

Zapoznaj się z popularnymi zasobami dla deweloperów

Sprawdź nasz przykładowy kod i zestawy SDK

Szybko twórz modele mowy za pomocą programu Speech Studio Stack Overflow

Zaufanie firm każdej wielkości

At&t zachwyci klientów immersyjnymi środowiskami

Firma AT&T prezentuje swoją sieć 5G przy pomocy pasjonującego doświadczenia umożliwiającego klientom bezpośrednią rozmowę z królikiem Bugs Bunny.*

*LOONEY TUNES oraz wszystkie powiązane znaki i elementy © & ™ Warner Bros. Entertainment Inc. (s21)

ATT

Firma Progressive udostępnia czatbota Flo bezpośrednio klientom

Firma Progressive użyła niestandardowego, neuronowego modelu głosu do utworzenia naturalnie brzmiącej, wirtualnej wersji Flo, aby pomóc klientom w wielu sprawach — od uzyskania bezpłatnej oferty ubezpieczeniowej samochodu, po ogólne pytania ubezpieczeniowe.

Progresywne

Firma KPMG usprawnia transkrypcję rozmów

Firma KPMG używa funkcji zamiany mowy na tekst do transkrypcji i katalogowania tysięcy połączeń, zmniejszając koszty zgodności dla swoich klientów nawet o 80%.

KPMG

Motorola pomaga pierwszym osobom odpowiadającym uzyskiwać dostęp do ważnych danych

Firma Motorola Solutions pomaga ratownikom w terenie uzyskiwać dostęp do istotnych informacji za pomocą wirtualnego asystenta głosowego.

Motorola Solutions

Wady konstrukcji dokumentów Hochtief używających głosu

Wirtualny asystent z obsługą głosu ułatwia menedżerom projektów budowlanych identyfikowanie i dokumentowanie defektów na placach budowy.

HOCHTIEF

Zencity poprawia jakość życia dzięki rozwiązaniom z zakresu sztucznej inteligencji

Uruchamianie danych i analiz Zencity używa tłumaczenia mowy do analizowania danych z różnych źródeł — mediów społecznościowych, żądań konserwacji i nie tylko — pomagając administracjom w podejmowaniu decyzji opartych na danych, które zapewniają lepsze usługi dla mieszkańców.

Zencity

Aktualizacje, blogi i ogłoszenia dotyczące usługi Mowa

Wszystko gotowe — utwórz bezpłatne konto platformy Azure