適用於 Azure 語音服務的 Ingestion Client 簡介
發佈日期: 六月 28, 2021
語音服務是一項 Azure 認知服務,可讓您建立可調整的解決方案,用以處理各種語音相關的工作,例如轉譯音訊、產生自然發音的聲音、辨識說話者,以及處理語音翻譯。
今天,我們要介紹的是 Ingestion Client,這是一項 Azure 解決方案,會監視特定的 Azure 儲存體 容器,對所有抵達該儲存體的音訊檔案進行自動轉譯。
我們打造的這項工具旨在協助您只需透過簡單的設定,而不需進行任何的開發工作,就可以設定功能完整、可調整且安全的轉譯管線。Ingestion Client 已收納各種最佳做法,可以將轉譯的要求最大化,包括規模的調整 (可處理上達數十萬個檔案)、錯誤管理、重試邏輯,以及其他各種最佳化功能。設定會透過 ARM 部署來執行。 下圖說明此 ARM 範本所部署解決方案的結構。
當使用者將音訊檔案上傳至專屬的 Azure 儲存體容器時,以計時器觸發的 Azure Functions 會挑選此檔案,並使用 語音轉換文字 REST API v3.0 或 語音 SDK (由使用者決定) 來建立轉譯要求。當轉譯作業成功完成後,解決方案會將轉譯結果寫入原先取得音訊檔案的容器中。 此外,使用者可以選擇對轉譯結果套用分析、產生報告或進行修訂,所有這些工作都是透過 ARM 範本所部署的其他資源來完成。