Přeskočit navigaci

Zpracování řeči Bingu

Převod zvuku na text, porozumění záměru a převod textu zpět do mluvené řeči pro poskytnutí přirozené odezvy

Rozpoznávání řeči

Mluvené slovo můžete převést na text. Rozhraní API můžete nakázat, aby zapnulo mikrofon a v reálném čase rozpoznávalo zvuk, který z něj přichází, aby rozpoznávalo zvuk přicházející z jiného zdroje zvuku v reálném čase nebo aby rozpoznávalo zvuk ze souboru. V každém případě je dostupná možnost streamování v reálném čase, takže současně s odesíláním zvuku na server se vrací také částečné výsledky rozpoznávání.

Služba Speech to Text API umožňuje sestavovat chytré aplikace aktivované hlasem. Chcete-li se podívat, jak to funguje, vyberte cílový jazyk a pak klikněte na mikrofon a začněte mluvit. Nebo jednoduše klikněte na některou z ukázkových frází, abyste viděli, jak rozpoznávání řeči funguje. Použitím této ukázky vyjadřujete souhlas s poskytnutím vašich hlasových vstupních dat Microsoftu pro účely vylepšování služeb.

Prohlédnout v akci

Pokud si chcete ukázku vyzkoušet s vlastním hlasem s použitím mikrofonu, použijte jiný prohlížeč s podporou WebRTC, jako je aktuální verze Microsoft Edge, Firefox nebo Chrome.

Chcete na tom stavět?

Převod textu na řeč

Text se dá převést na mluvené slovo. Když aplikace potřebuje na svoje uživatele „mluvit“, pomocí tohoto rozhraní API je možné převést text generovaný aplikací na zvuk, který se dá uživatelům přehrát.

Rozhraní API pro převod textu na řeč umožňuje vytvářet chytré aplikace, které mohou mluvit. Můžete si to hned vykoušet, jednoduše zvolte cílový jazyk, přidejte věty, klikněte na tlačítko pro přehrání a uvidíte, jak syntéza řeči funguje. Použitím této ukázky vyjadřujete souhlas s poskytnutím vašich hlasových vstupních dat Microsoftu pro účely vylepšování služeb.

Prohlédnout v akci

Zbývá 500 znaků

Chcete na tom stavět?

Prozkoumejte rozhraní API služeb Cognitive Services

Počítačové zpracování obrazu

Zjištění využitelných informací z obrázků

Tvář

Detekce, identifikace, analýza, uspořádání a označení tváří na fotografiích

Video Indexer PREVIEW

Odhalení nových poznatků z videí

Content Moderator

Automatizované moderování obrázků, textu a videa

Custom Vision PREVIEW

Jednoduché přizpůsobení vlastních špičkových modelů počítačového zpracování obrazu pro jedinečné případy použití

Analýza textu

Snadné vyhodnocení subjektivního hodnocení a témat a pochopení, co uživatelé chtějí

Translator Text

Snadný strojový překlad textů pomocí jednoduchého volání rozhraní REST API

Kontrola pravopisu Bingu

Rozpoznání a oprava pravopisných chyb ve vaší aplikaci

Content Moderator

Automatizované moderování obrázků, textu a videa

Language Understanding

Naučte svoje aplikace, aby rozuměly příkazům uživatelů

Zpracování řeči Bingu

Převod řeči na text a zpět a porozumění záměru uživatele

Rozpoznávání mluvčího PREVIEW

Jednotliví mluvčí se dají identifikovat a ověřit pomocí hlasu

Translator Speech

Snadné překládání řeči v reálném čase pomocí jednoduchého volání rozhraní REST API

Custom Speech PREVIEW

Překonání bariér rozpoznání řeči, jako jsou mluvený styl, šum na pozadí a slovník

Hlasové služby PREVIEW

Jednotné hlasové služby pro převod řeči na text, textu na řeč a překlad řeči

QnA Maker

Dostaňte z informací srozumitelné odpovědi, které lze snadno procházet.

Jste připravení posílit vaši aplikaci?