Omitir navegación

Servicios de voz

Convierta audio en texto, traduzca voz y convierta texto en voz con los servicios de voz unificados

Speech to Text: convierte audio con voz en texto para ofrecer una interacción intuitiva

Agregue fácilmente conversión de voz en texto en tiempo real a sus aplicaciones para casos como los comandos de voz, transcripciones en tiempo real o análisis de registros de un centro de llamadas.

Adapte sus modelos de reconocimiento de voz al estilo de habla de los usuarios, sus expresiones o vocabulario único, y también para acomodar ruidos de fondo específicos, acentos y patrones de voz en función del escenario.

Más información
Speech To Text

Text to Speech: ponga una voz natural en sus aplicaciones

Cree aplicaciones y servicios inteligentes que hablen a los usuarios de un modo natural con el servicio Text to Speech. Convierta texto en audio casi en tiempo real, adapte la velocidad de la voz, el tono, el volumen, etc.

Dé a sus aplicaciones una voz de marca única y reconocible usando modelos de voz personalizados. Solo tiene que grabar y cargar datos de entrenamiento y el servicio creará una fuente de voz única ajustada a la grabación.

Más información
Text to Speech

Speech Translation

Incorpore a su aplicación funcionalidad de traducción de voz en tiempo real para cualquiera de los idiomas admitidos y reciba la traducción en forma de texto o de voz. Los modelos de Speech Translation se basan en tecnologías vanguardistas de reconocimiento de voz y traducción automática neuronal (NMT). Están optimizados para comprender la forma de hablar de las personas en la vida real y generar traducciones de una calidad excepcional.

Más información
Speech Translation
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Vea las API de Cognitive Services

Computer Vision

Condense información de aplicación práctica a partir de imágenes

Face

Detecte, identifique, analice, organice y etiquete caras en las fotos

Video Indexer

Obtenga conocimiento de sus vídeos

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Custom Vision VERSIÓN PRELIMINAR

Personalice fácilmente los novedosos modelos de visión artificial para adaptarlos a su caso particular

Análisis de texto

Evaluar fácilmente las opiniones y temas para comprender lo que los usuarios quieren

Translator Text

Realice fácilmente una traducción automática con una llamada a la API de REST sencilla

Bing Spell Check

Detecte y corrija errores ortográficos en las aplicaciones

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Language Understanding

Enseñe a las aplicaciones a entender los comandos de sus usuarios

Servicios de voz

Servicios de voz unificados para la conversión de voz en texto y de texto en voz, y para la traducción de voz.

Speaker Recognition VERSIÓN PRELIMINAR

Use la voz para la identificación y verificación de hablantes individuales

QnA Maker

Convierta la información en respuestas de conversación de fácil navegación

¿Preparado para aumentar el potencial de su aplicación?