Zamiana mowy na tekst

Funkcja usługi Mowa, która dokładnie konwertuje dźwięk na tekst

Dźwięk mówiony z możliwością działania

Quickly and accurately transcribe audio to text in more than 85 languages and variants. Customize models to enhance accuracy for domain-specific terminology. Get more value from spoken audio by enabling search or analytics on transcribed text or facilitating action—all in your preferred programming language.

Transkrypcja o wysokiej jakości

Uzyskuj dokładne transkrypcje z użyciem najnowocześniejszej funkcji rozpoznawania mowy.

Dostosowywalne modele

Dodawaj określone słowa do podstawowego słownika lub twórz własne modele.

Elastyczne wdrożenia

Uruchamiaj zamianę mowy na tekst w dowolnym miejscu — w chmurze lub na urządzeniach brzegowych w kontenerach.

Gotowe do zastosowań produkcyjnych

Uzyskaj dostęp do tej samej niezawodnej technologii, która umożliwia rozpoznawanie mowy w produktach firmy Microsoft.

Wypróbuj funkcję zamiany mowy na tekst za pomocą tej aplikacji demonstracyjnej utworzonej na podstawie naszego zestawu JavaScript SDK

Aby wypróbować wersję demonstracyjną za pomocą Twojego własnego głosu przy użyciu mikrofonu, zmień przeglądarkę na inną, obsługującą protokół WebRTC, na przykład najnowszą wersję przeglądarki Microsoft Edge, Firefox lub Chrome.

Dane mowy nie będą przechowywane

Dokładnie przekształcaj mowę na tekst z różnych źródeł

Konwertuj dźwięk na tekst z różnych źródeł, w tym mikrofonów, plików audio i magazynu obiektów blob. Użyj funkcji dzielenia między głośniki, aby określić, kto, co i kiedy powiedział. Uzyskaj czytelne transkrypcje z automatycznym formatowaniem i interpunkcją.

Dostosowywanie modeli mowy do własnych potrzeb

Dostosuj modele mowy, aby rozpoznawać terminologię specyficzną dla organizacji i branży. Pokonaj bariery rozpoznawania mowy, takie jak hałas w tle, akcent czy unikatowe słownictwo. Dostosuj modele, przekazując dane audio i transkrypcje. Automatycznie generuj modele niestandardowe na podstawie danych z usługi Office 365, aby zoptymalizować dokładność rozpoznawania mowy pod kątem swojej organizacji.

Wdrażanie z dowolnego miejsca z chmury do brzegu

Run Speech to Text wherever your data resides. Build speech applications that are optimized for both robust cloud capabilities and edge locality using containers and language detection (preview). Speech containers support both standard and custom speech.

Kompleksowa ochrona prywatności i zabezpieczenia

  • Usługa Mowa jako część usług Azure Cognitive Services jest certyfikowana przez SOC, FedRAMP, PCI DSS, HIPAA, HITECH i ISO.
  • Twoje dane pozostają Twoimi. Twoje dane wejściowe audio i transkrypcja nie są rejestrowane podczas przetwarzania dźwięku.
  • Wyświetlaj i usuwaj niestandardowe dane oraz modele mowy w dowolnym momencie. Dane są szyfrowane, gdy są przechowywane w magazynie.
  • Wspierana przez infrastrukturę platformy Azure, usługa Mowa oferuje zabezpieczenia, dostępność, zgodność i możliwość zarządzania klasy korporacyjnej.

Elastyczny cennik zapewnia potrzebną moc i kontrolę

Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za zamianę mowy na tekst są naliczane zgodnie z rzeczywistym użyciem — na podstawie liczby godzin transkrybowanego dźwięku.

Dokumentacja i zasoby

Rozpocznij

Przeczytaj naszą dokumentacją

Weź udział w kursie Microsoft Learning

Eksplorowanie przykładów kodu

Zapoznaj się z naszym przykładowym kodem

Zobacz zasoby dotyczące dostosowywania

Dostosuj rozwiązanie do obsługi mowy za pomocą portalu Speech Studio. Brak konieczności pisania kodu.

Zaprojektowany z użyciem funkcji zamiany mowy na tekst

Firma KPMG usprawnia transkrypcję rozmów

Firma KPMG używa funkcji zamiany mowy na tekst do transkrypcji i katalogowania tysięcy godzin rozmów, zmniejszając o 80% koszty swoich klientów związane z zapewnieniem zgodności.

KPMG

Firma Motorola pomaga służbom ratowniczym uzyskać dostęp do najważniejszych danych przy użyciu głosu

Firma Motorola Solutions pomaga funkcjonariuszom policji i innym służbom ratowniczym szybciej uzyskiwać dostęp do ważnych informacji przy użyciu głosowego asystenta wirtualnego.

Motorola Solutions

Firma Universal Electronics zapewnia środowiska domów inteligentnych z obsługą głosową

Firma Universal Electronics pomaga markom w zapewnianiu głosowych możliwości nawigacji i kontroli, które działają na wielu urządzeniach domowych — oferując prawdziwie unikatowe środowisko klienta.

Universal Electronics

Firma Hochtief dokumentuje usterki konstrukcyjne przy użyciu głosu

Firma Hochtief pomaga menedżerom projektów identyfikować i dokumentować usterki konstrukcyjne na miejscu budowy przy użyciu głosowego asystenta wirtualnego.

Cheetah Mobile

Firma NTT DATA przyspiesza proces podejmowania decyzji dzięki analizom spotkań

Firma NTT DATA umożliwia analizowanie danych mowy dzięki transkrypcji spotkań w czasie rzeczywistym. Dzięki funkcji mowy niestandardowej można dostosowywać modele rozpoznawania mowy, aby umożliwić rozpoznawanie terminów specyficznych dla organizacji.

NTTDATA

Firma Insight obsługuje konwersacyjne środowiska bankowe

Firma Insight Enterprises pomaga bankom w przeniesieniu cyfrowej szybkości i wygody do oddziałów dzięki rozwiązaniu do bankowości obsługiwanemu przez konwersacyjną sztuczną inteligencję. Funkcja zamiany mowy na tekst konwertuje słowa wypowiadane przez klientów w dane, które można przetwarzać i analizować, aby zapewnić klientom szybkie i właściwe odpowiedzi.

Insight Enterprise, Inc.

Rozpocznij pracę z usługą Mowa