Omitir navegación

Bing Speech

Convierta audio en texto, comprenda el propósito y vuelva a convertir el texto en voz para una capacidad de respuesta natural

Reconocimiento de voz

Convierta audio con voz en texto. Se puede requerir a la API que se encienda para reconocer audio emitido por el micrófono en tiempo real, para que reconozca audio emitido desde otro origen de audio en tiempo real o para reconocer audio dentro de un archivo. En cualquier caso, se encuentra disponible la opción de streaming en tiempo real mediante la cual, al mismo tiempo que se envía el audio al servidor, se devuelven resultados parciales de reconocimiento.

Speech to Text API permite crear aplicaciones inteligentes que se activan por voz. Para ver cómo funciona, seleccione el idioma de destino, haga clic en el micrófono y empiece a hablar. También tiene la opción de hacer clic en las frases de voz de ejemplo para ver cómo funciona el reconocimiento de voz. Si usa esta demostración, significa que consiente ofrecer datos de entrada de voz a Microsoft para fines de mejora del servicio

Véala en acción

Para probar la demostración con su propia voz a través de un micrófono, cambie a un explorador distinto con compatibilidad para WebRTC, por ejemplo una versión reciente de Microsoft Edge, Firefox o Chrome.

Al cargar datos para esta demostración, acepta que Microsoft puede guardarlos y usarlos para mejorar los servicios Microsoft, entre los que se encuentra esta API. A fin de facilitar la protección de la privacidad, se adoptan medidas para desperzonalizar los datos y protegerlos. Los datos no se publicarán ni se permitirá que terceros los usen.

¿Desea crear esto?

Text to Speech

Convierta texto en audio con voz. Cuando las aplicaciones tienen que “responder” a los usuarios, se puede utilizar esta API para convertir texto generado por la aplicación en audio que el usuario puede reproducir.

Text-To-Speech API permite crear aplicaciones inteligentes que pueden hablar. Puede probarla ahora; para ello, solo tiene que elegir el idioma de destino, agregar las oraciones y hacer clic en el botón de reproducción para ver cómo funciona la síntesis de voz. Si usa esta demostración, significa que consiente ofrecer datos de entrada de voz a Microsoft para fines de mejora del servicio.

Véala en acción

500 caracteres a la izquierda

Al cargar datos para esta demostración, acepta que Microsoft puede guardarlos y usarlos para mejorar los servicios Microsoft, entre los que se encuentra esta API. A fin de facilitar la protección de la privacidad, se adoptan medidas para desperzonalizar los datos y protegerlos. Los datos no se publicarán ni se permitirá que terceros los usen.

¿Desea crear esto?

Vea las API de Cognitive Services

Computer Vision

Condense información de aplicación práctica a partir de imágenes

Face

Detecte, identifique, analice, organice y etiquete caras en las fotos

Video Indexer VERSIÓN PRELIMINAR

Obtenga conocimiento de sus vídeos

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Custom Vision VERSIÓN PRELIMINAR

Personalice fácilmente los novedosos modelos de visión artificial para adaptarlos a su caso particular

Análisis de texto

Evaluar fácilmente las opiniones y temas para comprender lo que los usuarios quieren

Translator Text

Realice fácilmente una traducción automática con una llamada a la API de REST sencilla

Bing Spell Check

Detecte y corrija errores ortográficos en las aplicaciones

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Language Understanding

Enseñe a las aplicaciones a entender los comandos de sus usuarios

Bing Speech

Convertir voz en texto y viceversa para comprender la intención del usuario

Speaker Recognition VERSIÓN PRELIMINAR

Use la voz para la identificación y verificación de hablantes individuales

Translator Speech

Realice fácilmente una traducción de voz en tiempo real con una llamada a la API de REST sencilla

Custom Speech VERSIÓN PRELIMINAR

Elimine las barreras del reconocimiento de voz, como el estilo de habla, el ruido de fondo y el vocabulario

Servicios de voz VERSIÓN PRELIMINAR

Servicios de voz unificados para la conversión de voz en texto y de texto en voz, y para la traducción de voz.

QnA Maker

Convierta la información en respuestas de conversación de fácil navegación

Custom Decision VERSIÓN PRELIMINAR

Una API basada en la nube para la toma de decisiones en contexto que mejora con la experiencia

¿Preparado para aumentar el potencial de su aplicación?