Zamiana mowy na tekst

Funkcja usługi Mowa, która dokładnie konwertuje dźwięk na tekst

Dźwięk mówiony z możliwością działania

Szybko i dokładnie przekształcaj dźwięk w tekst w ponad 30 językach. Dostosowuj modele w celu zwiększenia dokładności w przypadku terminologii specyficznej dla branży. Zwiększ użyteczność dźwięku mówionego przez włączenie wyszukiwania lub analizy uzyskanego tekstu lub ułatwianie działań — wszystko to w preferowanym języku programowania.

Transkrypcja o wysokiej jakości

Uzyskuj dokładne transkrypcje z użyciem najnowocześniejszej funkcji rozpoznawania mowy.

Dostosowywalne modele

Dodawaj określone słowa do podstawowego słownika lub twórz własne modele.

Elastyczne wdrożenia

Uruchamiaj zamianę mowy na tekst w dowolnym miejscu — w chmurze lub na urządzeniach brzegowych w kontenerach.

Gotowe do zastosowań produkcyjnych

Uzyskaj dostęp do tej samej niezawodnej technologii, która umożliwia rozpoznawanie mowy w produktach firmy Microsoft.

Wypróbuj funkcję zamiany mowy na tekst za pomocą tej aplikacji demonstracyjnej utworzonej na podstawie naszego zestawu JavaScript SDK

Aby wypróbować wersję demonstracyjną za pomocą Twojego własnego głosu przy użyciu mikrofonu, zmień przeglądarkę na inną, obsługującą protokół WebRTC, na przykład najnowszą wersję przeglądarki Microsoft Edge, Firefox lub Chrome.

Dane mowy nie będą przechowywane

Dokładnie przekształcaj mowę na tekst z różnych źródeł

Konwertuj dźwięk na tekst z różnych źródeł, w tym mikrofonów, plików audio i magazynu obiektów blob. Użyj funkcji dzielenia między głośniki, aby określić, kto, co i kiedy powiedział. Uzyskaj czytelne transkrypcje z automatycznym formatowaniem i interpunkcją.

Dostosowywanie modeli mowy do własnych potrzeb

Dostosuj modele mowy, aby rozpoznawać terminologię specyficzną dla organizacji i branży. Pokonaj bariery rozpoznawania mowy, takie jak hałas w tle, akcent czy unikatowe słownictwo. Dostosuj modele, przekazując dane audio i transkrypcje. Automatycznie generuj modele niestandardowe na podstawie danych z usługi Office 365, aby zoptymalizować dokładność rozpoznawania mowy pod kątem swojej organizacji.

Wdrażanie z dowolnego miejsca z chmury do brzegu

Uruchamiaj zamianę mowy na tekst wszędzie tam, gdzie znajdują się dane. Twórz aplikacje mowy, które są zoptymalizowane pod kątem zarówno niezawodnych funkcji chmury, jak i lokalnego charakteru urządzeń brzegowych, przy użyciu kontenerów (wersja zapoznawcza). Kontenery usługi Mowa obsługują mowę standardową i niestandardową.

Kompleksowa ochrona prywatności i zabezpieczenia

  • Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.
  • Twoje dane pozostają Twoimi. Twoje dane wejściowe audio i transkrypcja nie są rejestrowane podczas przetwarzania dźwięku.
  • Wyświetlaj i usuwaj niestandardowe dane oraz modele mowy w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.
  • Wspierana przez infrastrukturę platformy Azure, usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.

Elastyczny cennik zapewnia potrzebną moc i kontrolę

Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za zamianę mowy na tekst są naliczane zgodnie z rzeczywistym użyciem — na podstawie liczby godzin transkrybowanego dźwięku.

Dokumentacja i zasoby

Eksplorowanie przykładów kodu

Zobacz zasoby dotyczące dostosowywania

Dostosuj rozwiązanie do obsługi mowy za pomocą portalu Speech Studio. Brak konieczności pisania kodu.

KPMG

Firma KPMG korzysta z możliwości dostosowywania funkcji zamiany mowy na tekst, aby usprawnić transkrypcję i tłumaczenie połączeń telefonicznych, i osiąga dokładność transkrypcji na poziomie co najmniej 90%.

Rozpocznij pracę z usługą Mowa