Interfejs API rozpoznawania mowy Bing

Konwertowanie dźwięku na tekst, rozumienie intencji i konwertowanie z powrotem na mowę na potrzeby naturalnego reagowania

Rozpoznawanie mowy

Przekonwertuj mowę na tekst. Temu interfejsowi API można wydać polecenie włączenia się i rozpoznawania dźwięku z mikrofonu w czasie rzeczywistym, rozpoznawania dźwięku w czasie rzeczywistym pochodzącego z innego źródła audio lub rozpoznawania dźwięku z pliku. W każdym z przypadków jest dostępna opcja przesyłania strumieniowego w czasie rzeczywistym, dzięki której podczas przesyłania dźwięku na serwer zwracane są również częściowe wyniki rozpoznawania.

Interfejs API zamieniania mowy na tekst umożliwia tworzenie inteligentnych aplikacji wywoływanych głosem. Aby sprawdzić, jak to działa, wybierz swój język docelowy, a następnie kliknij mikrofon i zacznij mówić. Możesz też po prostu kliknąć jedno z przykładowych wyrażeń mowy, aby zobaczyć, jak działa rozpoznawanie mowy. Używając tej wersji demonstracyjnej, wyrażasz zgodę na udostępnienie swoich głosowych danych wejściowych firmie Microsoft na potrzeby udoskonalenia usługi

Zobacz, jak to działa

Aby wypróbować wersję demonstracyjną za pomocą Twojego własnego głosu przy użyciu mikrofonu, zmień przeglądarkę na inną, obsługującą protokół WebRTC, na przykład najnowszą wersję przeglądarki Microsoft Edge, Firefox lub Chrome.

Przekazując dane do tego pokazu, wyrażasz zgodę na przechowywanie ich przez firmę Microsoft i wykorzystanie w celu ulepszenia usług firmy Microsoft, w tym tego interfejsu API. Aby pomóc chronić Twoją prywatność, podejmujemy kroki w celu cofnięcia identyfikacji Twoich danych i przechowywania ich w bezpieczny sposób. Nie będziemy publikować Twoich danych ani udostępniać ich innym osobom do użytku.

Chcesz to skompilować?

Zamiana tekstu na mowę

Konwertuj tekst na dźwięk mówiony. Jeśli aplikacje muszą „odpowiedzieć” swoim użytkownikom, można użyć tego interfejsu API do konwertowania tekstu generowanego przez aplikację na dźwięk, który może zostać odtworzony użytkownikowi.

Interfejs API zamieniania tekstu na mowę umożliwia tworzenie inteligentnych aplikacji, które potrafią mówić. Możesz go teraz przetestować — po prostu wybierz swój język docelowy, dodaj swoje zdania i kliknij przycisk odtwarzania, aby zobaczyć, jak działa synteza mowy. Używając tej wersji demonstracyjnej, wyrażasz zgodę na udostępnienie swoich głosowych danych wejściowych firmie Microsoft na potrzeby udoskonalenia usługi.

Zobacz, jak to działa

Pozostała liczba znaków: 500

Przekazując dane do tego pokazu, wyrażasz zgodę na przechowywanie ich przez firmę Microsoft i wykorzystanie w celu ulepszenia usług firmy Microsoft, w tym tego interfejsu API. Aby pomóc chronić Twoją prywatność, podejmujemy kroki w celu cofnięcia identyfikacji Twoich danych i przechowywania ich w bezpieczny sposób. Nie będziemy publikować Twoich danych ani udostępniać ich innym osobom do użytku.

Chcesz to skompilować?

Poznaj interfejsy API usług Cognitive Services

Interfejs API wizualizacji komputerowej

Wyodrębnianie określonych informacji z obrazów

Interfejs API twarzy

Wykrywanie, identyfikowanie, analizowanie, organizowanie i znakowanie twarzy na zdjęciach

Content Moderator

Zautomatyzowane moderowanie obrazów, tekstu i filmów wideo

Interfejs API rozpoznawania emocji WERSJA ZAPOZNAWCZA

Personalizowanie środowisk użytkowników dzięki możliwości rozpoznawania emocji

Custom Vision Service WERSJA ZAPOZNAWCZA

Łatwo dostosowuj najwyższej klasy własne modele przetwarzania obrazów dla unikatowych przypadków użycia

Indeksator wideo WERSJA ZAPOZNAWCZA

Udostępnienie analiz wideo

Usługa interpretacji języka (LUIS)

Naucz aplikacje rozpoznawać polecenia użytkowników

Interfejs API analizy tekstu

Łatwe ocenianie opinii i tematów w celu zrozumienia potrzeb użytkowników

Interfejs API sprawdzania pisowni (Bing)

Wykrywaj i poprawiaj błędy pisowni w aplikacji

Interfejs API tekstu usługi Translator

Łatwe wykonywanie tłumaczenia maszynowego dzięki prostemu wywołaniu interfejsu API REST

Interfejs API modelu języka sieci Web WERSJA ZAPOZNAWCZA

Korzystanie z możliwości predykcyjnych modeli języków wytrenowanych na danych w skali sieci Web

Interfejs API analizy językowej WERSJA ZAPOZNAWCZA

Uprość złożone koncepcje językowe i analizuj tekst za pomocą interfejsu API analizy językowej

Interfejs API tłumaczenia mowy w usłudze Translator

Łatwe tłumaczenie mowy w czasie rzeczywistym dzięki prostemu wywołaniu interfejsu API REST

Interfejs API rozpoznawania osoby mówiącej WERSJA ZAPOZNAWCZA

Identyfikuj i uwierzytelniaj osoby mówiące na podstawie głosu

Interfejs API rozpoznawania mowy Bing

Konwertowanie mowy na tekst i tekstu na mowę w celu zrozumienia intencji użytkownika

Custom Speech Service WERSJA ZAPOZNAWCZA

Pokonaj bariery rozpoznawania mowy, takie jak styl wypowiedzi, hałas w tle czy słownictwo

Interfejs API usługi QnA Maker

Wydobądź z informacji konwersacyjne odpowiedzi, po których łatwo się poruszać

Knowledge Exploration Service

Uruchom środowiska obsługi interaktywnego wyszukiwania przez dane ze strukturą za pośrednictwem danych wejściowych języka naturalnego

Custom Decision Service

Chmurowy interfejs API służący do kontekstowego podejmowania decyzji, który mądrzeje wraz z doświadczeniem

Academic Knowledge API

Skorzystaj z ogromu zawartości akademickiej na wykresie Microsoft Academic Graph

Interfejs API usługi Entity Linking Intelligence Service

Zwiększ możliwości połączeń między danymi swojej aplikacji za pomocą rozpoznawania i rozróżniania nazwanych jednostek

Project Gesture

Gesture based controls

Project Knowledge Exploration

Previously called Knowledge Exploration Service API

Project Event Tracking

Event associated with Wikipedia entries

Project Academic Knowledge

Previously called Academic Knowledge

Project Local Insights

Location insights

Project Entity Linking

Previously called Entity Linking Intelligence Service API

Chcesz zrewolucjonizować swoją aplikację?