用于 Azure 语音的引入客户端简介
发布日期:六月 28, 2021
语音是一项 Azure 认知服务,可用于生成可处理各种语音相关任务(例如可听录音频、发出自然人声、识别说话人和处理语音翻译)的可缩放解决方案。
今天,我们将介绍引入客户端,它是一种 Azure 解决方案,将监视专用 Azure 存储容器,以便自动听录落入该存储空间的音频文件。
我们创建这一工具,是为了让你能够通过简单的配置,在不需要任何开发工作的情况下,设置完全成熟、可缩放且安全的脚本管道。引入客户端合并了最佳做法,以便在扩展(到数十万个文件)、错误管理、重试逻辑和各种其他优化等方面最大程度地改进脚本请求。通过 ARM 部署进行设置。 下图描述了此 ARM 模板部署的解决方案的体系结构。
当用户将音频文件上传到专用 Azure 存储容器时,触发 Azure Functions 的计时器会接受此文件,并使用语音转文本 REST API v3.0 或语音 SDK(由用户选择)来创建听录请求。听录成功完成时,该解决方案会将口述文本写入到从中获取音频文件的容器。 此外,用户还可以选择对口述文本应用分析、生成报告或添加编辑,这些都是通过 ARM 模板部署其他资源的结果。