음성 텍스트 변환 – 직관적인 상호 작용을 위해 음성 오디오를 텍스트로 변환
음성 명령, 대화 전사 및 콜 센터 로그 분석과 같은 시나리오를 위해 애플리케이션에 실시간 음성 텍스트 변환 기능을 쉽게 추가할 수 있습니다.
사용자의 말하기 스타일, 표현 및 고유한 어휘에 맞게 음성 인식 모델을 조정하고 배경 소음, 악센트 및 음성 패턴을 수용하세요.
자세한 정보
텍스트 음성 변환 – 앱에 자연스러운 음성 제공
텍스트 음성 변환 서비스를 통해 사람들에게 자연스럽게 말하는 스마트 앱과 서비스를 빌드하세요. 거의 실시간으로 텍스트를 오디오를 변환하고, 음성 속도, 피치, 볼륨 등을 맞춤형으로 변경할 수 있습니다.
사용자 지정 음성 모델을 사용하여 독특하고 인식 가능한 브랜드 음성을 애플리케이션에 제공하세요. 학습 데이터를 녹음하고 업로드하기만 하면 됩니다. 서비스에서 녹음에 맞게 고유한 음성 글꼴을 만듭니다.
자세한 정보
음성 번역
지원되는 임의 언어의 실시간 음성 번역 기능을 앱에 제공하고 텍스트 또는 음성 번역을 받을 수 있습니다. 음성 번역 모델은 첨단 음성 인식 및 NMT(중립 기계 번역) 기술을 기반으로 합니다. 사람들이 실제로 말하는 방식을 파악하고 독보적인 품질의 번역을 생성하도록 최적화되었습니다.
자세한 정보
음성 서비스를 기반으로 하는 비즈니스 시나리오
콜 센터 시나리오에 대해 향상된 일괄 처리 전사 및 사용자 지정 음성 서비스를 통해 모든 호출을 쉽게 기록하고 결과를 최적화할 수 있습니다. 전체 텍스트 검색을 위해 호출 전사를 인덱싱하거나 텍스트 분석을 적용하여 감정, 언어 및 인사이트를 위한 핵심 구문을 감지할 수 있습니다.
자세한 정보"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."
Cognitive Services API 살펴보기
Computer Vision API
이미지에서 실용적인 정보를 추출
Face
사진에서 얼굴을 감지, 식별, 분석, 구성 및 태그 지정
Video Indexer
비디오 인사이트 활용하기
Custom Vision
자신만의 사용 사례에 맞게 최신 컴퓨터 비전 모델을 쉽게 사용자 지정할 수 있습니다.
Form Recognizer
양식 특성을 이해하는 AI 기반 문서 추출 서비스
Text Analytics
정서와 주제를 간단히 평가하여 사용자가 원하는 것을 파악
Translator
간단한 REST API 호출로 손쉽게 기계 번역 수행
QnA Maker
정보를 탐색하기 쉬운 대화형 답변으로 추출
Language Understanding
앱이 사용자의 명령을 인식하도록 학습
몰입형 리더
모든 연령의 사용자가 장애 유무와 관계없이 텍스트를 읽고 이해할 수 있도록 지원
음성 서비스
음성 텍스트 변환, 텍스트 음성 변환 및 음성 번역을 위한 통합 음성 서비스
Speaker Recognition 미리 보기
화자를 검증하고 식별하는 음성 서비스 기능
텍스트를 음성으로 전환 (TTS)
텍스트를 실제 같은 음성으로 변환하는 음성 서비스 기능
Content Moderator
자동화된 이미지, 텍스트 및 비디오 조정
Anomaly Detector
앱에 변칙 검색 기능을 손쉽게 추가
Personalizer
맞춤형 사용자 환경을 제공하는 AI 서비스
메트릭 Advisor 미리 보기
메트릭을 모니터링하고 문제를 진단하는 AI 서비스