Zamiana mowy na tekst
Funkcja usługi Mowa, która dokładnie transkrybuje dźwięk na tekst
Dźwięk mówiony z możliwością działania
Szybko i dokładnie transkrybuj audio na tekst w ponad 100 językach i wariantach. Dostosuj modele, aby zwiększyć trafność w przypadku terminologii specyficznej dla domeny. Uzyskaj większą korzyść z mówionego pliku dźwiękowego, udostępniając wyszukiwanie lub analizę transkrybowanego tekstu lub ułatwiając działania — wszystko to w preferowanym języku programowania.
Transkrypcja o wysokiej jakości
Uzyskaj dokładne transkrypcje dźwięku na tekst z użyciem najnowocześniejszej funkcji rozpoznawania mowy.
Dostosowywalne modele
Dodawaj określone słowa do podstawowego słownika lub twórz własne modele zamiany mowy na tekst.
Elastyczne wdrożenia
Uruchamiaj zamianę mowy na tekst w dowolnym miejscu — w chmurze lub na urządzeniach brzegowych w kontenerach.
Gotowe do zastosowań produkcyjnych
Uzyskaj dostęp do tej samej niezawodnej technologii, która umożliwia rozpoznawanie mowy w produktach firmy Microsoft.
Wypróbuj funkcję zamiany mowy na tekst za pomocą tej aplikacji demonstracyjnej utworzonej na podstawie naszego zestawu JavaScript SDK
Aby wypróbować wersję demonstracyjną za pomocą Twojego własnego głosu przy użyciu mikrofonu, zmień przeglądarkę na inną, obsługującą protokół WebRTC, na przykład najnowszą wersję przeglądarki Microsoft Edge, Firefox lub Chrome.
Dane mowy nie będą przechowywane
Dokładne przekształcanie mowy na tekst z różnych źródeł
Konwertuj dźwięk na tekst z różnych źródeł, w tym mikrofonów, plików audio i magazynu obiektów blob. Użyj funkcji dzielenia między głośniki, aby określić, kto, co i kiedy powiedział. Uzyskaj czytelne transkrypcje z automatycznym formatowaniem i interpunkcją.
Dostosowywanie modeli mowy do własnych potrzeb
Dostosuj modele mowy, aby analizować terminologię specyficzną dla organizacji i branży. Pokonaj bariery rozpoznawania mowy, takie jak hałas w tle, akcenty czy unikatowe słownictwo. Dostosuj modele, przekazując dane audio i transkrypcje. Automatycznie generuj modele niestandardowe na podstawie danych z usługi Office 365, aby zoptymalizować dokładność rozpoznawania mowy pod kątem swojej organizacji.
Wdrażanie w dowolnym miejscu
Uruchamiaj zamianę mowy na tekst wszędzie tam, gdzie znajdują się dane. Twórz aplikacje mowy, które są zoptymalizowane pod kątem niezawodnych funkcji chmury i środowiska lokalnego, przy użyciu kontenerów.
Wspieraj innowacje w aplikacjach dzięki usługom sztucznej inteligencji w chmurze
Poznaj 5 kluczowych sposobów, w jakie Twoja organizacja może rozpocząć pracę ze sztuczną inteligencją, aby szybko zrealizować wartość.
Kompleksowa ochrona prywatności i zabezpieczenia
- Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.
- Twoje dane pozostają Twoimi. Twoje dane wejściowe audio i transkrypcja nie są rejestrowane podczas przetwarzania dźwięku.
- Wyświetlaj i usuwaj niestandardowe dane oraz modele mowy w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.
- Wspierana przez infrastrukturę platformy Azure usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.
Elastyczny cennik zapewnia potrzebną kontrolę
Opłaty za zamianę mowy na tekst są naliczane zgodnie z rzeczywistym użyciem — na podstawie liczby godzin transkrybowanego dźwięku, bez żadnych kosztów ponoszonych z góry.
Dokumentacja i zasoby
Rozpocznij
Przejrzyj dokumentację
Utwórz usługę rozpoznawania mowy za pomocą kursu na platformie Microsoft Learn
Eksplorowanie przykładów kodu
Zapoznaj się z naszym przykładowym kodem
Zobacz zasoby dotyczące dostosowywania
Odkrywaj i dostosuj swoje rozwiązanie zamiany głosu na tekst za pomocą usługi Speech Studio. Nie jest wymagany żaden kod.
Firmy, które ufają funkcji zamiany mowy na tekst
Firma KPMG usprawnia transkrypcję połączeń
Firma KPMG używa funkcji zamiany mowy na tekst do transkrypcji i katalogowania tysięcy godzin rozmów, zmniejszając o 80% koszty swoich klientów związane z zapewnieniem zgodności.

Firma Motorola pomaga służbom ratowniczym uzyskać dostęp do najważniejszych danych przy użyciu głosu
Firma Motorola Solutions pomaga funkcjonariuszom policji i innym służbom ratowniczym szybciej uzyskiwać dostęp do ważnych informacji przy użyciu głosowego asystenta wirtualnego.

Firma Universal Electronics zapewnia środowiska domów inteligentnych z obsługą głosową
Firma Universal Electronics pomaga markom w zapewnianiu głosowych możliwości nawigacji i kontroli, które działają na wielu urządzeniach domowych — oferując prawdziwie unikatowe środowisko klienta.

Wady konstrukcji dokumentów Hochtief używających głosu
Firma Hochtief pomaga menedżerom projektów identyfikować i dokumentować usterki konstrukcyjne na miejscu budowy przy użyciu głosowego asystenta wirtualnego.

Firma NTT DATA przyspiesza proces podejmowania decyzji dzięki analizom spotkań
Firma NTT DATA umożliwia analizowanie danych mowy dzięki transkrypcji spotkań w czasie rzeczywistym. Dzięki funkcji mowy niestandardowej można dostosowywać modele rozpoznawania mowy, aby umożliwić rozpoznawanie terminów specyficznych dla organizacji.

Firma Insight obsługuje konwersacyjne środowiska bankowe
Firma Insight Enterprises pomaga bankom w przeniesieniu cyfrowej szybkości i wygody do oddziałów dzięki rozwiązaniu do bankowości obsługiwanemu przez konwersacyjną sztuczną inteligencję. Funkcja zamiany mowy na tekst konwertuje słowa wypowiadane przez klientów w dane, które można przetwarzać i analizować, aby zapewnić klientom szybkie i właściwe odpowiedzi.

Często zadawane pytania dotyczące zamiany mowy na tekst
-
Jest to funkcja w ramach usługi Mowa, która precyzyjnie i szybko transkrybuje dźwięk na tekst.
-
Cognitive Services to kolekcja dostosowywalnych wstępnie utworzonych modeli AI, za pomocą których można dodawać sztuczną inteligencję do aplikacji. Należą one do kilku domen, w tym przetwarzanie mowy, podejmowanie decyzji, obsługa języka i przetwarzanie obrazu. Zamiana mowy na tekst jest jedną z funkcji w ramach usługi Mowa. Inne funkcje związane z mową obejmują zamianę tekstu na mowę, tłumaczenie mowy i rozpoznawanie osoby mówiącej. Przykładem usługi podejmowania decyzji jest Personalizacja, która umożliwia dostarczanie spersonalizowanych, dopasowanych środowisk. Przykłady usług językowych obejmują Language Understanding, analizę tekstu na potrzeby przetwarzania języka naturalnego, QnA Maker do obsługi często zadawanych pytań oraz Translator na potrzeby tłumaczenia języka.