Zamiana mowy na tekst

Konwertuj dźwięk na tekst, aby umożliwić bardziej naturalne interakcje

Zaawansowane rozpoznawanie mowy

Zamiana mowy na tekst to funkcja w ramach usługi Mowa, umożliwiająca błyskawicznie konwertowanie dźwięku z różnych źródeł na tekst. Dostosowuj modele, aby pokonać typowe trudności w rozpoznawaniu mowy, takie jak specyficzne słownictwo i style mówienia czy szum w tle. Ułatwiaj korzystanie z dźwięku tak, aby wszyscy mogli w czasie rzeczywistym śledzić konwersacje i w nich uczestniczyć.

Przełomowe innowacje

Skorzystaj z najdokładniejszego rozpoznawania mowy z wykorzystaniem modelu głębokich sieci neuronowych.

Zaangażowanie w czasie rzeczywistym

Zamieniaj dźwięk na tekst w czasie rzeczywistym, aby umożliwić pełne zaangażowanie w rozmowę wszystkim jej uczestnikom.

Niestandardowe rozpoznawanie mowy

Dostosuj rozpoznawanie mowy do stylu mówienia oraz specyficznej terminologii związanej z wybraną dziedziną.

Elastyczne wdrożenia

Uruchamiaj zamianę mowy na tekst w dowolnym miejscu — w chmurze, w środowisku lokalnym lub na urządzeniach brzegowych — za pomocą kontenerów.

Korzystaj z przełomowej technologii rozpoznawania mowy

Rozszerz aplikacje, dodając funkcje rozpoznawania mowy opracowane na podstawie kilkudziesięcioletnich, przełomowych badań naukowych. Rozwiązania firmy Microsoft jako pierwsze osiągnęły jakość porównywalną z człowiekiem w zadaniu rozpoznawania mowy podczas konwersacji telefonicznej, a firma wciąż prowadzi innowacyjne badania w zakresie rozpoznawania mowy.

Dowiedz się więcej o postępach w zakresie rozpoznawania mowy

Aby wypróbować wersję demonstracyjną za pomocą Twojego własnego głosu przy użyciu mikrofonu, zmień przeglądarkę na inną, obsługującą protokół WebRTC, na przykład najnowszą wersję przeglądarki Microsoft Edge, Firefox lub Chrome.

Chcesz to skompilować?

Optymalizowanie rozpoznawania mowy dzięki zindywidualizowanym modelom

Dostosowuj modele rozpoznawania mowy, aby pokonać typowe trudności. Dopasuj modele językowe do stylu mówienia i akcentu użytkowników lub do specyficznego słownictwa, takiego jak nazwy miejsc i produktów czy terminologia branżowa. Automatycznie generuj modele niestandardowe na podstawie danych z usługi Office 365, aby zoptymalizować dokładność rozpoznawania mowy pod kątem terminów specyficznych dla organizacji.

Rozpocznij korzystanie z usługi Mowa niestandardowa

Przykładowe zdania

Punkt odniesienia

Mowa niestandardowa

Chcesz to skompilować?

Uzyskuj szczegółowe informacje z konwersacji

Twórz transkrypcję wieloosobowych konwersacji w czasie rzeczywistym, ułatwiając uczestnikom skupienie się na dyskusji. Rozpoznawaj, kto, co i kiedy powiedział, szybko przechodząc do następnych kroków. Zoptymalizuj środowisko w przypadku urządzeń z wieloma mikrofonami. Zastosuj analizy tekstu transkrypcji, aby uzyskać więcej szczegółowych informacji z konwersacji.

Dowiedz się więcej o funkcji transkrypcji konwersacji

Wdrażanie z dowolnego miejsca z chmury do brzegu

Uruchamiaj zamianę mowy na tekst za pomocą kontenerów w chmurze lub lokalnie, gdy najważniejsze jest bezpieczeństwo danych i niskie opóźnienie.

Dowiedz się więcej o usłudze Mowa w kontenerach

Zabezpieczenia dla przedsiębiorstwa

  • Firma Microsoft inwestuje ponad 1 mld USD rocznie w badania i rozwiązania z zakresu cyberbezpieczeństwa.

  • Zatrudniamy ponad 3 500 ekspertów w dziedzinie zabezpieczeń, którzy są w pełni skoncentrowani na ochronie danych i prywatności.

  • Platforma Azure ma więcej certyfikatów w zakresie zgodności w porównaniu z innymi dostawcami usług w chmurze. Wyświetl pełną listę.

Uzyskaj potrzebną Ci moc, kontrolę i dostosowania w elastycznych cenach

Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Opłaty za zamianę mowy na tekst są naliczane zgodnie z rzeczywistym użyciem — na podstawie liczby godzin transkrybowanego dźwięku.

Zobacz cennik zamiany mowy na tekst

Rozpocznij pracę z zamianą mowy na tekst w trzech krokach

Uzyskaj błyskawiczny dostęp i środki w wysokości 200 USD, tworząc bezpłatne konto platformy Azure.
Zaloguj się do witryny Azure Portal i dodaj usługę Mowa.
Dowiedz się, jak osadzić funkcję zamiany mowy na tekst, korzystając z przewodników Szybki start i dokumentacji.

Zamiana mowy na tekst — zasoby dla deweloperów

Dokumentacja i samouczki

Rozpocznij pracę z zamianą mowy na tekst.

Kursy

Skorzystaj z kursu firmy Pluralsight, przedstawiającego korzystanie z zamiany mowy na tekst krok po kroku.

Przypadki zastosowań

Dowiedz się więcej o scenariuszach dotyczących funkcji zamiany mowy na tekst, takich jak transkrypcja konwersacji i nagrań w centrach telefonicznej obsługi klienta.

Często zadawane pytania dotyczące zamiany mowy na tekst

  • Pełną listę języków obsługiwanych przez usługę zamiany mowy na tekst zawiera dokumentacja.
  • Łatwo rejestruj dźwięk z mikrofonu, odczytuj ze strumienia danych lub uzyskuj dostęp do plików audio z magazynu za pomocą zestawu SDK usługi Mowa i interfejsów API REST. Zestaw SDK usługi Mowa obsługuje na potrzeby rozpoznawania mowy jednokanałowy, 16-bitowy dźwięk w formacie WAV/PCM z częstotliwością próbkowania 16 kHz/8 kHz. Inne formaty dźwięku są obsługiwane za pomocą punktu końcowego REST zamiany mowy na tekst lub usługi transkrypcji wsadowej.

Rozpoczynanie pracy z zamianą mowy na tekst