Zamiana mowy na tekst
Funkcja usługi Mowa, która dokładnie konwertuje dźwięk na tekst
Wypróbuj bezpłatnie usługi Cognitive Services
Gość
7-dniowa wersja próbna
Bezpłatnie oceń usługi Cognitive Services
Bezpłatne konto platformy Azure
$0 miesięcznie
Wypróbuj, korzystając z bezpłatnego konta platformy Azure
Istniejące konto platformy Azure
Masz już konto platformy Azure?
Dźwięk mówiony z możliwością działania
Szybko i dokładnie twórz transkrypcje dźwięku na tekst w ponad 85 językach i odmianach. Dostosowuj modele w celu zwiększenia dokładności w przypadku terminologii specyficznej dla branży. Zwiększ użyteczność dźwięku mówionego przez włączenie wyszukiwania lub analizy uzyskanego tekstu lub ułatwianie działań — wszystko to w preferowanym języku programowania.
Transkrypcja o wysokiej jakości
Uzyskuj dokładne transkrypcje z użyciem najnowocześniejszej funkcji rozpoznawania mowy.
Dostosowywalne modele
Dodawaj określone słowa do podstawowego słownika lub twórz własne modele.
Elastyczne wdrożenia
Uruchamiaj zamianę mowy na tekst w dowolnym miejscu — w chmurze lub na urządzeniach brzegowych w kontenerach.
Gotowe do zastosowań produkcyjnych
Uzyskaj dostęp do tej samej niezawodnej technologii, która umożliwia rozpoznawanie mowy w produktach firmy Microsoft.
Wypróbuj funkcję zamiany mowy na tekst za pomocą tej aplikacji demonstracyjnej utworzonej na podstawie naszego zestawu JavaScript SDK
Aby wypróbować wersję demonstracyjną za pomocą Twojego własnego głosu przy użyciu mikrofonu, zmień przeglądarkę na inną, obsługującą protokół WebRTC, na przykład najnowszą wersję przeglądarki Microsoft Edge, Firefox lub Chrome.
Dane mowy nie będą przechowywane
Dokładnie przekształcaj mowę na tekst z różnych źródeł
Konwertuj dźwięk na tekst z różnych źródeł, w tym mikrofonów, plików audio i magazynu obiektów blob. Użyj funkcji dzielenia między głośniki, aby określić, kto, co i kiedy powiedział. Uzyskaj czytelne transkrypcje z automatycznym formatowaniem i interpunkcją.
Dostosowywanie modeli mowy do własnych potrzeb
Dostosuj modele mowy, aby rozpoznawać terminologię specyficzną dla organizacji i branży. Pokonaj bariery rozpoznawania mowy, takie jak hałas w tle, akcent czy unikatowe słownictwo. Dostosuj modele, przekazując dane audio i transkrypcje. Automatycznie generuj modele niestandardowe na podstawie danych z usługi Office 365, aby zoptymalizować dokładność rozpoznawania mowy pod kątem swojej organizacji.
Wdrażanie z dowolnego miejsca z chmury do brzegu
Uruchamiaj zamianę mowy na tekst wszędzie tam, gdzie znajdują się dane. Twórz aplikacje mowy, które są zoptymalizowane pod kątem zarówno niezawodnych funkcji chmury, jak i lokalnego charakteru urządzeń brzegowych, przy użyciu kontenerów i funkcji wykrywania języka (wersja zapoznawcza). Kontenery usługi Mowa obsługują mowę standardową i niestandardową.
Kompleksowa ochrona prywatności i zabezpieczenia
- Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.
- Twoje dane pozostają Twoimi. Twoje dane wejściowe audio i transkrypcja nie są rejestrowane podczas przetwarzania dźwięku.
- Wyświetlaj i usuwaj niestandardowe dane oraz modele mowy w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.
- Wspierana przez infrastrukturę platformy Azure, usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.
Elastyczny cennik zapewnia potrzebną moc i kontrolę
Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za zamianę mowy na tekst są naliczane zgodnie z rzeczywistym użyciem — na podstawie liczby godzin transkrybowanego dźwięku.
Dokumentacja i zasoby
Eksplorowanie przykładów kodu
Zapoznaj się z naszym przykładowym kodem
Zobacz zasoby dotyczące dostosowywania
Dostosuj rozwiązanie do obsługi mowy za pomocą portalu Speech Studio. Brak konieczności pisania kodu.
Zaprojektowany z użyciem funkcji zamiany mowy na tekst
Firma KPMG usprawnia transkrypcję rozmów
Firma KPMG używa funkcji zamiany mowy na tekst do transkrypcji i katalogowania tysięcy godzin rozmów, zmniejszając o 80% koszty swoich klientów związane z zapewnieniem zgodności.

Firma Motorola pomaga służbom ratowniczym uzyskać dostęp do najważniejszych danych przy użyciu głosu
Firma Motorola Solutions pomaga funkcjonariuszom policji i innym służbom ratowniczym szybciej uzyskiwać dostęp do ważnych informacji przy użyciu głosowego asystenta wirtualnego.

Firma Universal Electronics zapewnia środowiska domów inteligentnych z obsługą głosową
Firma Universal Electronics pomaga markom w zapewnianiu głosowych możliwości nawigacji i kontroli, które działają na wielu urządzeniach domowych — oferując prawdziwie unikatowe środowisko klienta.

Firma Hochtief dokumentuje usterki konstrukcyjne przy użyciu głosu
Firma Hochtief pomaga menedżerom projektów identyfikować i dokumentować usterki konstrukcyjne na miejscu budowy przy użyciu głosowego asystenta wirtualnego.

Firma NTT DATA przyspiesza proces podejmowania decyzji dzięki analizom spotkań
Firma NTT DATA umożliwia analizowanie danych mowy dzięki transkrypcji spotkań w czasie rzeczywistym. Dzięki funkcji mowy niestandardowej można dostosowywać modele rozpoznawania mowy, aby umożliwić rozpoznawanie terminów specyficznych dla organizacji.

Firma Insight obsługuje konwersacyjne środowiska bankowe
Firma Insight Enterprises pomaga bankom w przeniesieniu cyfrowej szybkości i wygody do oddziałów dzięki rozwiązaniu do bankowości obsługiwanemu przez konwersacyjną sztuczną inteligencję. Funkcja zamiany mowy na tekst konwertuje słowa wypowiadane przez klientów w dane, które można przetwarzać i analizować, aby zapewnić klientom szybkie i właściwe odpowiedzi.
