Navigatie overslaan

Spraakservices

Audio omzetten naar tekst, spraak omzetten en tekst-naar-spraak met de gemeenschappelijke spraakservices

Spraak naar tekst: hierbij wordt gesproken audio omgezet naar tekst voor intuïtieve interactie

Voeg gemakkelijk realtime omzetting van spraak naar tekst toe aan uw toepassingen voor onder andere spraakopdrachten, realtime transcripties of de analyse van logboeken voor een callcenter.

Stem de spraakherkenningsmodellen zo af dat deze worden aangepast aan de spraakstijlen, uitdrukkingen of de specifieke woordenschat van de gebruikers en dat daarbij rekening wordt gehouden met bepaalde achtergrondgeluiden, accenten en spraakpatronen, afhankelijk van het scenario.

Meer informatie
Spraak naar tekst

Tekst naar spraak: voeg een natuurlijke stem toe aan uw apps

Ontwikkel slimme apps en services die op natuurlijke wijze met gebruikers spreken met de Tekst-naar-Spraak-service. Zet tekst bijna in realtime om in audio en stem hiervan onder andere de spraaksnelheid, de toonhoogte en het volume af.

Voeg aan uw toepassing een unieke, herkenbare stem toe met behulp van de aangepaste stemmodellen. Neem gewoon oefengegevens op en upload deze. De service maakt vervolgens een unieke spraakstijl die is afgestemd op de opname.

Meer informatie
Tekst naar spraak

Spraakomzetting

Voeg mogelijkheden voor realtime spraakomzetting in een van de ondersteunde talen toe aan uw app en ontvang als gevolg daarvan tekst of spraakomzetting. Spraakomzettingsmodellen zijn gebaseerd op geavanceerde technologieën voor spraakherkenning en Neural Machine Translation (NMT). Ze zijn zo geoptimaliseerd dat ze kennis hebben van de wijze waarop mensen in de praktijk spreken en genereren omzettingen van hoge kwaliteit.

Meer informatie
Spraakomzetting
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Ontdek de Cognitive Services-API's

Computer Vision

Distilleer actiegegevens uit afbeeldingen

Face

Herken, identificeer, analyseer, organiseer en tag gezichten in foto's

Video Indexer

Meer inzichten dankzij video

Content Moderator

Geautomatiseerd afbeeldings-, tekst- en videotoezicht

Custom Vision PREVIEW

U kunt uw eigen geavanceerde Vision-modellen aanpassen met het oog op uw specifieke situatie

Tekstanalyse

Gevoelens en onderwerpen evalueren om te begrijpen wat gebruikers willen

Translator Text

Gemakkelijk machinevertaling uitvoeren door eenvoudig een REST API aan te roepen

Bing Spellingcontrole

Detecteer en corrigeer spelfouten in uw app

Content Moderator

Geautomatiseerd afbeeldings-, tekst- en videotoezicht

Language Understanding

Leer uw apps opdrachten van uw gebruikers te begrijpen

Spraakservices

Samengevoegde spraakservices voor spraak-naar-tekst en spraakomzetting

Sprekerherkenning PREVIEW

Gebruik spraak voor het identificeren en verifiëren van individuele sprekers

QnA Maker

Distilleer informatie in beschrijvende, gemakkelijk te navigeren antwoorden

Klaar om uw app een enorme impuls te geven?