Pomiń nawigację

Usługi mowy

Konwertowanie dźwięku na tekst, wykonywanie tłumaczenia mowy i zamiana mowy na tekst przy użyciu ujednoliconych usług mowy

Zamiana mowy na tekst — konwertuje dźwięk mowy na tekst na potrzeby intuicyjnej interakcji

Z łatwością dodaj do swoich aplikacji konwersję mowy na tekst w czasie rzeczywistym na potrzeby takich zastosowań jak polecenia głosowe, transkrypcje w czasie rzeczywistym czy analiza dzienników telefonicznego biura obsługi.

Dopasuj modele rozpoznawania mowy, aby uwzględnić style mówienia, wyrażenia czy unikatowe słownictwo użytkowników oraz hałas w tle, akcenty i wzorce głosowe w zależności od scenariusza.

Dowiedz się więcej
Zamiana mowy na tekst

Zamiana tekstu na mowę — dodaj naturalny głos do swoich aplikacji

Twórz inteligentne aplikacje i usługi mówiące do użytkowników w języku naturalnym dzięki usłudze zamiany tekstu na mowę. Przekształcaj tekst na dźwięk w czasie niemal rzeczywistym, zmieniaj szybkość, ton, głośność mowy itd.

Używając niestandardowych modeli głosowych, dodaj do swojej aplikacji jedyny w swoim rodzaju, rozpoznawalny głos firmowy. Po prostu nagraj i przekaż dane szkoleniowe, a w usłudze zostanie utworzona unikalna czcionka głosowa dostosowana do Twojego nagrania.

Dowiedz się więcej
Zamiana tekstu na mowę

Tłumaczenie mowy

Dodaj do swojej aplikacji funkcje tłumaczenia mowy w czasie rzeczywistym w dowolnym z obsługiwanych języków, aby otrzymać tłumaczenie w postaci tekstu lub mowy. Modele tłumaczenia mowy są oparte na najnowocześniejszych technologiach rozpoznawania mowy i tłumaczenia maszynowego w sieci neuronowej (NMT). Zostały one zoptymalizowane pod kątem rozumienia sposobu mówienia ludzi w prawdziwym życiu i generowania wyjątkowej jakości tłumaczeń.

Dowiedz się więcej
Tłumaczenie mowy
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Poznaj interfejsy API usług Cognitive Services

Przetwarzanie obrazów

Wyodrębnianie określonych informacji z obrazów

Rozpoznawanie twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Indeksator wideo

Udostępnienie analiz wideo

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Niestandardowe przetwarzanie obrazów WERSJA ZAPOZNAWCZA

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Analiza tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Tłumaczenie tekstu w usłudze Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

Sprawdzanie pisowni Bing

Wykrywaj i poprawiaj błędy pisowni w aplikacji

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Language Understanding

Naucz aplikacje rozpoznawać polecenia użytkowników

Usługi mowy

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

Rozpoznawanie osoby mówiącej WERSJA ZAPOZNAWCZA

Identyfikuj i weryfikuj osoby mówiące na podstawie głosu

QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Chcesz zrewolucjonizować swoją aplikację?