Usługi mowy

Konwertowanie dźwięku na tekst, wykonywanie tłumaczenia mowy i zamiana mowy na tekst przy użyciu ujednoliconych usług mowy

Zamiana mowy na tekst — konwertuje dźwięk mowy na tekst na potrzeby intuicyjnej interakcji

Z łatwością dodaj do swoich aplikacji możliwości zamiany mowy na tekst w czasie rzeczywistym na potrzeby takich scenariuszy jak polecenia głosowe, transkrypcja konwersacji czy analiza dzienników centrum telefonicznej obsługi klienta.

Dopasuj modele rozpoznawania mowy, aby uwzględnić style mówienia, wyrażenia czy unikatowe słownictwo użytkowników oraz hałas w tle, akcenty i wzorce głosowe.

Dowiedz się więcej
Zamiana mowy na tekst

Zamiana tekstu na mowę — dodaj naturalny głos do swoich aplikacji

Twórz inteligentne aplikacje i usługi mówiące do użytkowników w języku naturalnym dzięki usłudze zamiany tekstu na mowę. Przekształcaj tekst na dźwięk w czasie niemal rzeczywistym, zmieniaj szybkość, ton, głośność mowy itd.

Używając niestandardowych modeli głosowych, dodaj do swojej aplikacji jedyny w swoim rodzaju, rozpoznawalny głos firmowy. Po prostu nagraj i przekaż dane szkoleniowe, a w usłudze zostanie utworzona unikalna czcionka głosowa dostosowana do Twojego nagrania.

Dowiedz się więcej
Zamiana tekstu na mowę

Tłumaczenie mowy

Dodaj do swojej aplikacji funkcje tłumaczenia mowy w czasie rzeczywistym w dowolnym z obsługiwanych języków, aby otrzymać tłumaczenie w postaci tekstu lub mowy. Modele tłumaczenia mowy są oparte na najnowocześniejszych technologiach rozpoznawania mowy i tłumaczenia maszynowego w sieci neuronowej (NMT). Zostały one zoptymalizowane pod kątem rozumienia sposobu mówienia ludzi w prawdziwym życiu i generowania wyjątkowej jakości tłumaczeń.

Dowiedz się więcej
Tłumaczenie mowy

Scenariusze biznesowe utworzone na podstawie usług mowy

Łatwo transkrybuj każdą rozmowę i optymalizuj wyniki dzięki transkrypcji wsadowej i niestandardowym usługom mowy rozszerzonym pod kątem scenariuszy występujących w centrach telefonicznej obsługi klienta. Utwórz indeks transkrypcji rozmów na potrzeby wyszukiwania pełnotekstowego lub zastosuj analizę tekstu w celu wykrycia tonacji, języka i fraz kluczowych, aby uzyskać szczegółowe informacje.

Dowiedz się więcej
Usługi mowy dla biznesu
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Poznaj interfejsy API usług Cognitive Services

Przetwarzanie obrazów

Wyodrębnianie określonych informacji z obrazów

Rozpoznawanie twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Rozpoznawanie pisma odręcznego

Oparta na sztucznej inteligencji usługa umożliwiająca rozpoznawanie zawartości w postaci pisma cyfrowego, na przykład pisma ręcznego, kształtów i układu pisanych odręcznie dokumentów

Indeksator wideo

Udostępnienie analiz wideo

Niestandardowe przetwarzanie obrazów

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Rozpoznawanie formularzy

Napędzana przez sztuczną inteligencję usługa wyodrębniania dokumentów, która rozpoznaje formularze

Analiza tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Tłumaczenie tekstu w usłudze Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Language Understanding

Naucz aplikacje rozpoznawać polecenia użytkowników

Czytnik immersyjny

Zwiększ możliwości użytkowników w każdym wieku i z różnymi zdolnościami w zakresie czytania i rozumienia tekstu

Usługi mowy

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

Rozpoznawanie osoby mówiącej

Identyfikuj i weryfikuj osoby mówiące na podstawie głosu

Tłumaczenie mowy

Łatwe integrowanie tłumaczenia mowy w czasie rzeczywistym z aplikacją

Zamiana mowy na tekst

Konwertuj dźwięk na tekst, aby umożliwić bardziej naturalne interakcje

Zamiana tekstu na mowę

Konwertuj tekst na mowę w celu tworzenia bardziej naturalnych i lepiej dostępnych interfejsów

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i wideo

Narzędzie do wykrywania anomalii

Łatwo dodawaj funkcje wykrywania anomalii do aplikacji.

Personalizacja

Usługa sztucznej inteligencji udostępniająca spersonalizowane środowisko użytkownika

Chcesz zrewolucjonizować swoją aplikację?