Usługi mowy
Konwertowanie dźwięku na tekst, wykonywanie tłumaczenia mowy i zamiana mowy na tekst przy użyciu ujednoliconych usług mowy
Szybko twórz wysokiej jakości aplikacje obsługujące głos
Bezpiecznie i szybko twórz aplikacje obsługujące głos dzięki zestawowi Speech SDK. Transkrybuj zamianę mowy na tekst z dużą dokładnością, twórz brzmiące naturalnie głosy zamiany tekstu na mowę, tłumacz dźwięk mówiony i używaj rozpoznawania mówcy podczas rozmów. Odkrywaj bez użycia kodu i twórz modele niestandardowe dostosowane do Twojej aplikacji za pomocą usługi Speech Studio.
Wiodąca w branży jakość
Pobierz najnowocześniejsze funkcje zamiany mowy na tekst, realistyczny tekst na mowę i nagradzane rozpoznawanie osoby mówiącej.
Zgodne i bezpieczne
Twoje dane pozostają Twoje — dane wejściowe mowy nie są rejestrowane podczas przetwarzania.
Dostosowywalne głosy i modele
Tworzenie głosów niestandardowych, dodawanie określonych wyrazów do słownictwa podstawowego lub tworzenie własnych modeli.
Elastyczne wdrożenia
Uruchamiaj usługę Mowa w dowolnym miejscu, w chmurze lub na urządzeniach brzegowych, używając do tego kontenerów.

Konwertowanie mowy na tekst
Szybko i dokładnie transkrybuj dźwięk w ponad 100 językach i wariantach. Zdobądź informacje o kliencie dzięki transkrypcji w call center, popraw doświadczenia asystentów obsługujących głos, uchwyć kluczowe dyskusje podczas spotkań i nie tylko.

Nadaj głos swojej aplikacji
Używaj zamiany tekstu na mowę, aby tworzyć aplikacje i usługi mówiące konwersacyjnie. Twórz brzmiącą naturalnie zawartość audio, zwiększaj dostępność za pomocą funkcji czytania na głos i twórz niestandardowych asystentów głosowych.

Tłumaczenie mowy w czasie rzeczywistym
Przetłumacz dźwięk z ponad 30 języków i dostosuj tłumaczenia dla określonych terminów organizacji — wszystko to w preferowanym języku programowania.

Weryfikuj i rozpoznawaj osoby mówiące
Potwierdź tożsamość osoby lub rozpoznaj, kto mówi na spotkaniu, dodając weryfikację osoby mówiącej i jej identyfikację do aplikacji.

Aktywuj asystenta lub urządzenie IoT za pomocą niestandardowego słowa kluczowego
Utwórz niestandardowe słowo kluczowe dla urządzeń IoT i asystentów z obsługą głosu, aby wyróżnić swoją markę — dzięki czemu będzie bardziej osobista, spersonalizowana i bezpieczna.

Dodaj polecenia głosowe dla scenariuszy bez użycia rąk
Twórz bezdotykowe środowisko oparte na głosie, aby zwiększyć bezpieczeństwo i obsługiwać scenariusze powrotu do pracy.
Wbudowane funkcje kompleksowych zabezpieczeń i zgodności
-
Firma Microsoft inwestuje ponad miliard dolarów (USD 1mld) rocznie w badania i rozwiązania w zakresie cyberbezpieczeństwa.
-
Zatrudniamy ponad 3,500 ekspertów w dziedzinie zabezpieczeń, którzy są skoncentrowani na ochronie danych i prywatności.
-
Platforma Azure ma więcej certyfikatów w porównaniu z innymi dostawcami usług w chmurze. Wyświetl pełną listę.
Elastyczny cennik zapewnia potrzebną moc i kontrolę
Płać tylko za to, czego używasz, bez ponoszenia kosztów z góry. Dzięki funkcji Mowa, płać zgodnie z rzeczywistym użyciem na podstawie:
- Liczba godzin transkrypcji lub tłumaczenia dźwięku na mowę na tekst i tłumaczenie mowy.
- Liczba znaków konwertowania na dźwięk w zamianie tekstu na mowę
- Liczba transakcji dla rozpoznawania osoby mówiącej
Dokumentacja i zasoby usługi Mowa
Wprowadzenie do usług mowy
Przejrzyj dokumentację
Weź udział w kursie Microsoft Learn poświęconym usłudze Mowa
Eksploruj popularne zasoby deweloperów
Sprawdź nasz przykładowy kod i zestawy SDK
Szybko twórz modele mowy za pomocą programu Speech Studio Stack Overflow
Zaufane przez firmy każdej wielkości
At&t zachwyci klientów immersyjnymi środowiskami
Firma AT&T prezentuje swoją sieć 5G przy pomocy wciągającego doświadczenia umożliwiającego klientom bezpośrednią rozmowę z królikiem Bugs Bunny.*
*LOONEY TUNES oraz wszystkie powiązane znaki i elementy © & ™ Warner Bros. Entertainment Inc. (s21)

Firma Progressive udostępnia czatbota Flo bezpośrednio klientom
Firma Progressive użyła niestandardowego, neuronowego modelu głosu do utworzenia naturalnie brzmiącej, wirtualnej wersji Flo, aby pomóc klientom w wielu sprawach — od uzyskania bezpłatnej oferty ubezpieczeniowej samochodu, po ogólne pytania ubezpieczeniowe.

Firma KPMG usprawnia transkrypcję rozmów
Firma KPMG używa funkcji zamiany mowy na tekst do transkrypcji i katalogowania tysięcy połączeń, zmniejszając koszty zgodności dla swoich klientów nawet o 80%.

Motorola pomaga pierwszym osobom odpowiadającym uzyskiwać dostęp do ważnych danych
Firma Motorola Solutions pomaga ratownikom w terenie uzyskiwać dostęp do istotnych informacji za pomocą wirtualnego asystenta głosowego.

Firma Hochtief dokumentuje usterki konstrukcyjne przy użyciu głosu
Wirtualny asystent z obsługą głosu ułatwia menedżerom projektów budowlanych identyfikowanie i dokumentowanie defektów na placach budowy.

Zencity poprawia jakość życia dzięki rozwiązaniom z zakresu sztucznej inteligencji
Uruchamianie danych i analiz Zencity używa tłumaczenia mowy do analizowania danych z różnych źródeł — mediów społecznościowych, żądań konserwacji i nie tylko — pomagając administracjom w podejmowaniu decyzji opartych na danych, które zapewniają lepsze usługi dla mieszkańców.

Aktualizacje, blogi i ogłoszenia dotyczące usługi Mowa
-
AKTUALIZACJA
Public preview: Azure Cognitive Services updates